1. 首页
  2. 编程语言
  3. 其他
  4. kmeans中文文本聚类java源码包括对文本tfidf的计算文本相似度计算

kmeans中文文本聚类java源码包括对文本tfidf的计算文本相似度计算

上传者: 2019-02-19 12:53:29上传 RAR文件 8.54KB 热度 62次
算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现
用户评论
码姐姐匿名网友 2019-02-19 12:53:29

还可以,就是数据量大跑起来太慢。

码姐姐匿名网友 2019-02-19 12:53:29

还不错的哦

码姐姐匿名网友 2019-02-19 12:53:29

代码可用,不过还得修改一下才行,聚类聚的不是很好。不过也算是有个基础的东西来修改了

码姐姐匿名网友 2019-02-19 12:53:29

不错的参考资料

码姐姐匿名网友 2019-02-19 12:53:29

Neither good nor bad.

码姐姐匿名网友 2019-02-19 12:53:29

很好的东西,是拿来学习用的

码姐姐匿名网友 2019-02-19 12:53:29

很好 不错,评价有点晚,但是是好东西

码姐姐匿名网友 2019-02-19 12:53:29

一般般 还不能导入工程

码姐姐匿名网友 2019-02-19 12:53:29

不错,修改了K值后跑出来的结果感觉还可以

码姐姐匿名网友 2019-02-19 12:53:29

可以,谢谢分享