PimaIndiansDiabetes数据集
Pima 印第安人糖尿病数据集的压缩包,文件名是diabetes-data.tar.Z.z,还挺经典的,多模型教程都拿它练手用。数据结构简单清晰,适合初学者练习特征选择和分类算法。
标准格式的 CSV 数据,包含怀孕次数、血糖浓度、BMI 等字段,起来没啥坑。你可以直接用pandas读进来,或者丢给TensorFlow、PyTorch直接建模。
嗯,如果你是在学逻辑回归、KNN、SVM这类经典算法,用这份数据集挺合适的。数据量不大,跑模型快,调参数也方便。
推荐你看看下面这些资源链接,都是围绕这个数据集展开的应用和下载地址,像PimaIndiansDiabetes、皮马印第安人、UCI 糖尿病数据这几个关键词你也见过。
如果你是做医疗方向建模的,可以顺便扩展下,结合其他临床数据做特征工程。哦对,注意字段中有些值是 0,记得先清洗下再建模。
下载地址
用户评论