基于谱维约简的密度自适应亲和力传播聚类算法
作为一种新颖的聚类方法,相似性传播(AP)聚类可以通过在数据点之间传递消息来识别高质量的聚类中心。 但是它的最终簇数受用户定义的自信心参数影响。 当由于先验知识而针对给定数量的集群时,必须启动AP多次,直到找到合适的自信心设置为止。 K-AP算法克服了这一缺点通过在消息传递过程中引入约束来利用K簇的即时结果。 K-AP聚类的关键是构建合适的相似度矩阵,该矩阵可以真实反映数据集的内在结构。 本文设计了一种密度自适应相似度量,以更合理地描述数据点之间的关系。 同时,为了解决K-AP算法在高维数据集中面临的困难,我们采用基于谱图理论的降维方法将原始数据点映射到低维本征空间,提出了密度自适应算法。基于频谱降维的AP聚类算法。 实验表明,该算法可以有效地解决结构复杂,规模多的数据集聚类问题,避免了高维特征向量引起的奇异性问题。 它的聚类性能优于AP聚类算法和K-AP算法。
用户评论