泰坦尼克号乘客生存预测模型

Name: 泰坦尼克号乘客生存预测模型
Rating: 4.5 (75 reviews)
Author: download_21472

上传者：download_21472 2023-03-10 21:06:36上传 ZIP文件 51.15KB 热度 75次

import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import cross_val_score
from sklearn.preprocessing import OneHotEncoder

# 读取数据
data = pd.read_csv("data.csv")
data.head(1)

# 数据清洗
data.drop(['PassengerId', 'Name', 'Ticket', 'Cabin'], axis=1, inplace=True)
data['Age'].fillna(data['Age'].mean(), inplace=True)
data['Embarked'].fillna('S', inplace=True)

# 特征提取
X = data.iloc[:, 1:].values
y = data.iloc[:, 0].values
enc = OneHotEncoder()
X = enc.fit_transform(X).toarray()

# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 模型训练与评估
params = {
    'max_depth': [5, 10, 15],
    'max_features': [5, 10, 15],
    'min_samples_leaf': [1, 2, 5],
}
clf = RandomForestClassifier(n_estimators=100, random_state=42)
grid_search = GridSearchCV(clf, params, cv=5)
grid_search.fit(X_train, y_train)
print(grid_search.best_params_)
print(grid_search.best_score_)
scores = cross_val_score(grid_search, X_train, y_train, cv=5)
print(scores.mean())

# 可视化
feature_importances = grid_search.best_estimator_.feature_importances_
plt.bar(range(X.shape[1]), feature_importances)
plt.show()

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

泰坦尼克号乘客生存预测模型

import pandas as pdfrom sklearn.tree import Decisi...

大小：51.15KB | 2023-03-10 21:06:36
Python实现泰坦尼克号乘客生存预测

通过使用Python语言和包括的数据集，如何预测泰坦尼克号乘客在灾难中的生还情况。我们包含了源代码以...

大小：36.27KB | 2023-04-02 02:27:02
预测泰坦尼克号乘客幸存率

预测泰坦尼克号乘客幸存率安装要求这个项目要求使用Python2.7以及安装下列python库NumP...

大小：173.06KB | 2023-01-19 07:05:53
泰坦尼克预测乘客生存概率

大小：0B | 2019-02-25 03:50:02
泰坦尼克号生还者预测模型

基于数据分析和机器学习技术，我们构建了一种预测泰坦尼克号乘客生还情况的模型。通过收集乘客信息、船舱等...

大小：43.48KB | 2023-11-17 20:46:40
泰坦尼克号生存源码

泰坦尼克号生存

大小：88KB | 2021-02-23 18:48:52
泰坦尼克号生存者预测测试集

泰坦尼克号生存者预测测试集。泰坦尼克海难是著名的十大灾难之一,究竟多少人遇难,各方统计的结果不一。现...

大小：28KB | 2020-09-20 13:55:22
泰坦尼克号生存者预测训练集

泰坦尼克号生存者预测训练集。泰坦尼克海难是著名的十大灾难之一,究竟多少人遇难,各方统计的结果不一。现...

大小：21KB | 2020-09-20 13:55:24
泰坦尼克号生存预测数据集

泰坦尼克号生存预测数据集泰坦尼克号生存预测数据集Taitanicdata.zip

大小：0B | 2020-06-10 19:11:48
随机森林泰坦尼克号生存预测.ipynb

随机森林:泰坦尼克号生存预测随机森林:

大小：51KB | 2020-11-06 18:54:10
泰坦尼克号预测源码

泰坦尼克号预测

大小：83KB | 2021-02-23 18:49:06
Kaggle泰坦尼克号生存源码

Kaggle-泰坦尼克号生存在该存储库中,我已经在kaggle的titani数据集上练习了DS和M...

大小：90KB | 2021-02-23 18:48:54
泰坦尼克号幸存预测

kaggle上面的Titanic比赛，77%的正确率，模型是逻辑回归。

大小：0B | 2020-06-07 20:08:59
泰坦尼克号

泰坦尼克号数据集包含train和test数据集，总共11列数据

大小：0B | 2019-09-22 02:10:31
决策树泰坦尼克号生存预测.ipynb

决策树:泰坦尼克号生存预测决策树:

大小：120KB | 2020-11-06 04:51:34
泰坦尼克号预测生存概率数据集

里面包含训练集和测试集，总共1200多条数据，涉及年龄，性别，船仓号等信息可用于数据挖掘

大小：0B | 2019-05-28 14:59:06