论文研究一种基于数据场的K均值算法.pdf 上传者:宛陵秋 2019-09-15 04:25:37上传 PDF文件 384.23KB 热度 62次 针对K-均值算法在随机选取初始类中心时存在不足、对噪声和孤立点敏感、不适用于发现大小差别很大的类的问题,借鉴分子间的相互作用力模型,将文本模拟成数据场中的数据点,综合考虑文本间的相似度和相异度,提出一个新的数据势值计算公式。根据文本数据的势,剔除孤立点、确定初始类中心。实验结果证明,该算法可以提高收敛速度,消除噪声和孤立点对聚类结果的影响,提高聚类的精度,适用于主题分布不均匀的文本集。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论