在这个项目中我们用到的是来自UCI机器学习的数据集这是一份美国人口的调查数据打开数据集我们会发现列名全部都丢失了完好的数据集在这里下载训练集测试集.http archive.ics.uci.edu ml machine learning databases census income mld查看模糊矩阵得到的结果模型准确率达到95.68并且特异度Specificity也就是对负样本的预测准确率达到75.84可以说已经非常不错了至此UCI人口调查数据的折腾就暂时告一段落了如果有时间我还会继续发表研究这个数据以及学习xgboost的心得