airQuality:根据天气和时间特征预测空气质量 源码
目录 动机 该数据集包含通过传感器测量的空气化学物质。 提供了一组稀有的化学物质地面真实值以及有关湿度,温度和日期时间的信息。 我在该项目中的目标是预测空气中化学物质的存在,并获得一些对哪些参数影响最大的有用信息。 特征工程 通过提取一天中的时间(早晨,下午,晚上,晚上,夜晚,睡眠时间),星期几和月份,我们可以从datetime列中获得一些有用的功能。 我还决定对化学药品的数量进行汇总,以获得一个目标变量。 该步骤的好处是减小了目标变量空间的尺寸。 数据预处理 立即观察到,NMHC地面真相(缺少90%以上的样本)是不可靠的功能,因此应予以删除。 数据的成对图可视化表明,应将化学值归一化,因为它们相对于彼此的大小并不重要。 此步骤还将进一步帮助我们对化学物质进行汇总,作为特征工程的一部分。 第一要务是填补化学品的缺失的地面真实值。 换句话说,我们将使用传感器数据在给定的时间范围内填充缺失的真
用户评论