preprocessing_pipeline_chicago:创建要导入的程序包以用于ML管道中的预处理步骤 源码
preprocessing_pipeline_chicago 创建一个包,用于使用混合数据预处理特定的数据集。 通过使用随机森林分类器预测类,保存模型以及对新数据使用腌制版来测试过程。 打包功能 给column_separator一个数据帧,一个目标变量以及带有日期或警钟的特殊列的标识符。 然后,该函数将变量标识为数字或类别变量,不包括特殊列和目标列。 sample_splitter被赋予一个数据帧,一个目标变量,一个子样本值和一个测试大小,并将数据分为X和y,进行训练和测试。 打包变压器 NullMaker被赋予一个数据帧,并寻找应该由空值表示的字符串值,例如“ UNKNOWN”,然后将其转换为np.nan。 BeatFormatter被指定为出现次数的拍子列,并将拍子号转换为两位数的累加值。 给DateFormatter以字符串形式表示的日期列,并将其转换为熊猫时间戳。
用户评论