kaggle titanic Kaggle Titanic Comp
泰坦尼克号这是我在参加Kaggle泰坦尼克号比赛时编写的python/scikit-learn代码。有几种不同算法的代码,但主要和性能最高的一种是在randomforest2.py中实现的RandomForest。要求: python(2.x版本至少为2.6) scikit-learn/NumPy/SciPy ( )熊猫( ) matplotlib ( )用法: > python randomforest2.py关键文件: loaddata.py:包含所有特征工程,包括用于生成不同变量类型、执行PCA、聚类和类平衡的选项randomforest2.py:执行管道的代码scorereport.py:检查并报告超参数搜索的结果learningcurve.py:包括生成学习曲线的代码roc_auc:包括生成ROC曲线的代码其他文
用户评论