1. 首页
  2. 数据库
  3. 其它
  4. titanic数据集的目标是根据乘客信息预测他们在Titanic号撞击冰山沉没后能否生存

titanic数据集的目标是根据乘客信息预测他们在Titanic号撞击冰山沉没后能否生存

上传者: 2020-12-22 13:31:12上传 PDF文件 199.62KB 热度 12次
一,准备数据 titanic数据集的目标是根据乘客信息预测他们在Titanic号撞击冰山沉没后能否生存。 结构化数据一般会使用Pandas中的DataFrame进行预处理。 字段说明: Survived:0代表死亡,1代表存活【y标签】 Pclass:乘客所持票类,有三种值(1,2,3) 【转换成onehot编码】 Name:乘客姓名 【舍去】 Sex:乘客性别 【转换成bool特征】 Age:乘客年龄(有缺失) 【数值特征,添加“年龄是否缺失”作为辅助特征】 SibSp:乘客兄弟姐妹/配偶的个数(整数值) 【数值特征】 Parch:乘客父母/孩子的个数(整数值)【数值特征】 Ticket:票
用户评论