kaggle titanic:适用于Kaggle Titanic竞赛的Jupyter笔记本 源码
卡格勒-泰坦尼克号 适用于Kaggle Titanic竞赛的Jupyter笔记本 诊断以改进Titanic Kaggle竞赛中的模型 ,2021年4月 1912年4月15日发生的泰坦尼克号沉没是历史上最著名的海难之一。 它构成了Kaggle入门的基础。 这场比赛的基础是二进制分类问题:根据泰坦尼克号上乘客的特征,预测泰坦尼克号沉没后他们是否还幸免于难。 在本笔记本中,我将经历设计最佳模型以预测生存的过程: 对问题的理解 数据探索 清理数据 特征工程 选型 模型的超参数优化 模型测试 我在Kaggle竞赛中补充了机器学习问题的这些常见元素,重点是以下内容: 使用混淆矩阵,ROC曲线和曲线下面积(AUC)分数评估模型预测。 这样可以深入了解修改二元分类器的阈值,以减少误报或误报(I型和II型错误),这适用于许多二元分类问题,例如医疗保健中的问题。 诊断会根据模型中存在偏差或变异的证据,
用户评论