1. 首页
  2. 数据库
  3. 其它
  4. 分布式信息理论聚类

分布式信息理论聚类

上传者: 2021-03-17 03:00:05上传 PDF文件 2.12MB 热度 14次
网络上的分布式数据收集和分析无处不在,尤其是在无线传感器网络(WSN)上。 分布式集群是分布式数据分析中最重要的主题之一。 期望探索在地理上分散的节点中收集/存储的数据的隐藏结构。 近年来,已经基于K-means算法或高斯混合模型开发了几种分布式数据聚类技术。 在这些方法中,仅通过基于一阶和二阶统计量的度量来捕获数据结构。 当集群数据的结构复杂时,这些统计信息不足,可能会导致聚类结果不理想。 在这种情况下,使用信息理论方法可以实现更好的聚类性能,因为它们考虑了聚类数据的整个分布。 在这项工作中,我们将信息理论方法纳入分布式聚类的成本函数中,以提出线性和内核分布式聚类算法。 在算法中,每个节点通过与其相邻节点的扩散协作来解决局部聚类问题。 为了保护隐私并节省通信成本,在协作中,节点仅与它们的一跳邻居交换一些参数而不是原始数据。 仿真结果表明,所提出的分布式算法在合成数据和真实数据上都能获得与相应的集中式信息理论聚类算法几乎相同的聚类结果。
用户评论