Titanic dataset 源码
泰坦尼克号数据集 数据已分为两类:1.训练集(train.csv)2.测试集(test.csv)训练集应用于构建机器学习模型。 应该使用测试集来查看您的模型在看不见的数据上的表现如何。 变量注释pclass:社会经济地位(SES)的代表1st =较高2nd =中等3rd =较低 年龄:如果小于1,则年龄是小数。如果估计了年龄,则采用xx.5的形式 简介:数据集以这种方式定义家庭关系...兄弟姐妹=兄弟,姐妹,继兄弟,继母配偶=丈夫,妻子(情妇和未婚夫被忽略) parch:数据集以这种方式定义家庭关系...父母=母亲,父亲孩子=女儿,儿子,继女,继子有些孩子只带一个保姆旅行,因此parch = 0。 对于给定的上述数据,已在代码中使用ML进行了预处理和EDA。
用户评论