1. 首页
  2. 数据库
  3. 其它
  4. 数据预处理及特征工程

数据预处理及特征工程

上传者: 2020-12-31 05:24:12上传 PDF文件 108KB 热度 16次
1.异常值处理 通过箱线图(或 3-Sigma)删除异常值或设置为缺失值; 长尾截断; 以下代码是根据箱线图处理异常值封装的函数: def outliers_proc(data, col_name, scale=3): """ 用于清洗异常值,默认用 box_plot(scale=3)进行清洗 :param data: 接收 pandas 数据格式 :param col_name: pandas 列名 :param scale: 尺度 :return: """ def box_plot_outliers(data_ser, box
用户评论