1. 首页
  2. 数据库
  3. 其它
  4. 数据挖掘学习之路四:Python去极值方法

数据挖掘学习之路四:Python去极值方法

上传者: 2020-12-31 14:01:25上传 PDF文件 35.86KB 热度 22次
1. MAD #MAD(mean absolute deviation)又称为绝对值差中位数法,是一种先需计算所有因子与平均值之间的距离总和来检测离群值的方法. #处理的逻辑: #第一步,找出所有因子的中位数 Xmedian #第二步:得到每个因子与中位数的绝对偏差值 Xi?Xmedian #第三步:得到绝对偏差值的中位数 MAD #第四步:确定参数 n,从而确定合理的范围为 [Xmedian?nMAD,Xmedian+nMAD],并针对超出合理范围的因子值做如下的调整 #超出最大值的用最大值代替,小于最小值的用最小值代替。 def filter_extreme_MAD(series,n):
下载地址
用户评论