1. 首页
  2. 人工智能
  3. 机器学习
  4. 复旦大学文本分类语料[完整版 训练集+测试集]

复旦大学文本分类语料[完整版 训练集+测试集]

上传者: 2020-06-17 13:05:31上传 ZIP文件 105.93MB 热度 30次
answer文件夹为测试语料,共9833篇文档;train文件夹为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试集压缩包各50多兆)
下载地址
用户评论