1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 基于层次聚类识别数据集前n个全局孤立点.pdf

论文研究 基于层次聚类识别数据集前n个全局孤立点.pdf

上传者: 2020-07-19 08:11:53上传 PDF文件 483.3KB 热度 11次
孤立数据的存在使数据挖掘结果不准确,甚至错误。现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,为此,提出一种有效的全局孤立点检测方法,该方法进行凝聚层次聚类,根据聚类树和距离矩阵来可视化判断数据孤立程度,确定孤立点数目。从聚类树自顶向下,无监督地去除离群数据点。在多个数据集上的仿真实验结果表明,该方法能有效识别孤立程度最大的前n个全局孤立点,适用于不同形状的数据集,算法效率高,用户友好,且适用于大型高维数据集的孤立点检测。
用户评论