1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究一种基于数据场的K均值算法.pdf

论文研究一种基于数据场的K均值算法.pdf

上传者: 2019-09-15 04:25:37上传 PDF文件 384.23KB 热度 27次
针对K-均值算法在随机选取初始类中心时存在不足、对噪声和孤立点敏感、不适用于发现大小差别很大的类的问题,借鉴分子间的相互作用力模型,将文本模拟成数据场中的数据点,综合考虑文本间的相似度和相异度,提出一个新的数据势值计算公式。根据文本数据的势,剔除孤立点、确定初始类中心。实验结果证明,该算法可以提高收敛速度,消除噪声和孤立点对聚类结果的影响,提高聚类的精度,适用于主题分布不均匀的文本集。
下载地址
用户评论