20200322零基础入门数据挖掘 – 二手车交易价格预测笔记(2)
二、EDA-数据探索性分析 前面的步骤就不做赘述了,我在下载好资料后,在jupyter notebook里将数据导入,随后进行课程内容的一系列指导操作,熟悉数据集,包括: 2.1 载入各种数据科学以及可视化库: 数据科学库 pandas、numpy、scipy; 可视化库 matplotlib、seabon; 其他; 2.2 载入数据: 载入训练集和测试集; 简略观察数据**(head()+shape)**; 2.3 数据总览: 通过**describe()**来熟悉数据的相关统计量 通过**info()**来熟悉数据类型 2.4 判断数据缺失和异常 查看每列的存在nan情况 异常值检测 2.
用户评论