1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于数据集压缩的聚类算法性能优化研究.pdf

论文研究基于数据集压缩的聚类算法性能优化研究.pdf

上传者: 2020-06-08 21:26:36上传 PDF文件 1.05MB 热度 15次
针对目前聚类算法对大数据集的聚类分析中存在时间花费过大的问题,提出了一种基于最近邻相似性的数据集压缩算法。通过将若干个相似性最近邻的数据点划分成一个数据簇并随机选择簇头构成新的数据集,大大缩减了数据的规模。然后分别采用K-means算法和AP算法对压缩后的数据集进行聚类分析。实验结果表明,压缩后的数据集与原始数据集的聚类分析相比,在保证聚类准确率基本一致的前提下,有效降低了聚类的花费时长,提高了算法的聚类性能,证明了该数据集压缩算法在聚类分析中的有效性和可靠性。
用户评论