基于MCL与Chameleon的混合聚类算法
马尔科夫聚类算法(Markov Cluster Algorithm, MCL)是一种快速且可扩展的无监督图聚类算法,Chameleon是一种新的层次聚类算法。但MCL由于过拟合会产生很多小聚类,Chameleon由于时间复杂度为O(N2)不利于处理大规模数据集。针对这两个问题,提出了一种基于MCL与Chameleon相结合的混合聚类算法。该算法第一阶段采用MCL算法对原始数据进行初步聚类,第二阶段利用GPU加速的Chameleon算法将第一阶段产生的小聚类进行归并,从而得到质量更高的聚类。实验表明,与传统的MCL算法和MCL与KNN的混合聚类算法,提出的方法聚类质量更好、计算速度更快。
下载地址
用户评论