异常值处理
机器学习异常值处理,数据预处理之异常值处理一、什么样的值是异常值?简单来说,即在数据集中存在不合理的值,又称离群点。我们举个例子,做客户分析,发现客户的年平均收入是80万美元。但是,有两个客户的年收入是4美元和420万美元。这两个客户的年收入明显不同于其他人,那这两个观察结果将被视为异常值。二、什么会引起异常值呢?每当我们遇到异常值时,处理这些异常值的理想方法就是找出引起这些异常值的原因。处理它们的方法将取决于它们发生的原因,异常值的原因可以分为两大类:
下载地址
用户评论