1. 首页
  2. 数据库
  3. 其它
  4. 数据挖掘:数据清洗——异常值处理

数据挖掘:数据清洗——异常值处理

上传者: 2021-01-31 20:01:25上传 PDF文件 807.5KB 热度 32次
数据挖掘:数据清洗——异常值处理 一、离群点是什么? 离群点,是一个数据对象,它显著不同于其他数据对象,与其他数据分布有较为显著的不同。有时也称非离群点为“正常数据”,离群点为“异常数据”。 离群点跟噪声数据不一样,噪声是被观测变量的随机误差或方差。一般而言,噪声在数据分析(包括离群点分析)中不是令人感兴趣的,需要在数据预处理中剔除的,减少对后续模型预估的影响,增加精度。 离群点检测是有意义的,因为怀疑产生它们的分布不同于产生其他数据的分布。因此,在离群点检测时,重要的是搞清楚是哪种外力产生的离群点。 常见的异常成因: 数据来源于不同的类(异常对象来自于一个与大多数数据对象源(类)不同的源(类
用户评论