1. 首页
  2. 人工智能
  3. 机器学习
  4. 中文文档分类数据集下载-数据挖掘实践

中文文档分类数据集下载-数据挖掘实践

上传者: 2023-04-20 07:09:42上传 ZIP文件 1.4MB 热度 18次

这里提供清华大学中文文档分类数据集的下载地址以及相应的使用说明。数据集包含女性、体育、文学、校园等四个分类,训练集和测试集分别存放在train和test文件夹中,停用词在stop文件夹内。我们建议您使用朴素贝叶斯分类算法对训练集进行处理和分析,并在验证过程中继续优化您的算法。测试集的准确率将会是您进行数据挖掘实践的关键指标之一。

下载地址
用户评论