Datawhale从零开始数据挖掘第二次打卡
Task2数据分析 参考资料 数据处理之二——数据探索性分析(EDA) 数据科学学习手札62 数据探索性分析(EDA) EDA (Exploratory Data Analysis),也就是对数据进行探索性的分析,从而为之后的数据预处理和特征工程提供必要的结论。 拿到数据之后,我们必须要明确以下几件事: 数据是如何产生的,又是如何储存的 数据是原始数据,还是经过人工处理的 数据有哪些业务背景组成的,数据字段有什么含义 数据字段是什么类型的,每个字段的分布是怎样的 训练集的数据和测试集的数据分布是否有差异 再发分析数据的过程中,还要弄清楚以下问题: 数据量是否充分,是否有外部数据可以进行补充 数
用户评论