1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究一种快速网页检索结果聚类策略.pdf

论文研究一种快速网页检索结果聚类策略.pdf

上传者: 2020-05-18 11:40:25上传 PDF文件 506.25KB 热度 20次
在网页聚类中,HAC(HierarchicalAgglomerativeClustering)算法和K-means算法都是经常用到的。但它们都有各自的不足。提出一种两阶段聚类方法。第一阶段利用HAC聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始中心用K-means算法聚类标题和摘要取得比较合理的聚类结果。由于标题一般都比较短,可以大大减少HAC算法的运行时间。这样既满足网络检索对时间的要求又可以得到较好的聚类结果。
下载地址
用户评论