1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于MapReduce的随机抽样Kmeans算法.pdf

论文研究基于MapReduce的随机抽样Kmeans算法.pdf

上传者: 2020-02-07 03:25:10上传 PDF文件 630.27KB 热度 42次
K-means算法处理海量数据时,易产生系统内存溢出的现象。利用MapReduce框架改进K-means虽然解决了这个问题,但也存在着聚类效果不稳定以及准确率不高等问题,提出一种改进算法,利用MapReduce框架实现K-means时,采用多次随机抽样,通过计算密度、距离与平方误差等方法,最终选取较优的初始聚类中心,并在迭代中采用新的中心点计算方法。实验结果证明,改进后的算法具有较好的稳定性、准确性和加速比。
下载地址
用户评论