1. 首页
  2. 考试认证
  3. 其它
  4. 数据挖掘面试题

数据挖掘面试题

上传者: 2019-05-15 17:20:20上传 RAR文件 39.55KB 热度 28次
一、异常值是指什么?请列举1种识别连续型变量异常值的方法?异常值(Outlier)是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。Grubbs’test(是以FrankE.Grubbs命名的),又叫maximumnormedresidualtest,是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。
用户评论