1. 首页
  2. 课程学习
  3. 数据库
  4. 复旦中文文本分类语料训练集

复旦中文文本分类语料训练集

上传者: 2020-04-20 15:26:28上传 RAR文件 50.38MB 热度 55次
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
用户评论
码姐姐匿名网友 2020-04-20 15:26:28

一般般吧,还是可以看下。