1. 首页
  2. 人工智能
  3. 机器学习
  4. 银联数据分类练习决策树模型构建及评估

银联数据分类练习决策树模型构建及评估

上传者: 2023-03-11 07:12:40上传 IPYNB文件 133.78KB 热度 14次

经过银联分类练习,成功构建了决策树模型,并在测试集上取得了较好的预测效果。在处理数据之前,我们首先观察了数据集,对数据的缺失值进行处理并绘制了折线图。通过对缺失值数据量排序,最终留下125个属性。对分类属性的缺失值直接进行删除,对连续属性的缺失值用K近邻的方法进行插值,其中近邻的个数选择为3。对数据的分类变量x027与x033进行Onehot编码处理。进行数据降维处理,运用PCA的方法将数据的维度降为6个维度。在原始数据集中未逾期的数据有7658条,逾期的数据有2043条,我们进行SMOTE抽样,通过调参sampling strategy系数调为0.83即调为54的抽样比。接着进行决策树的构建,通过熵调参确定参数最大深度为12,最小分裂叶节点为0.008。最终,模型的预测精确率达到了0.63,召回率达到了0.67,f1score达到了0.65,且经过ROC与KS曲线的绘制,AUC的面积为0.7227,ks值为0.2317,可见模型是可用的。

下载地址
用户评论