1. 首页
  2. 课程学习
  3. 讲义
  4. 中文文本分类语料(复旦)-测试集下载

中文文本分类语料(复旦)-测试集下载

上传者: 2019-04-27 00:00:20上传 RAR文件 51.14MB 热度 76次
这个链接是测试集,训练集请见我的资源本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
下载地址
用户评论
码姐姐匿名网友 2019-04-27 00:00:20

很好用的资源,多谢

码姐姐匿名网友 2019-04-27 00:00:20

很好的资源

码姐姐匿名网友 2019-04-27 00:00:20

很不错的资源,

码姐姐匿名网友 2019-04-27 00:00:20

良心资源 很不错 谢谢诶

码姐姐匿名网友 2019-04-27 00:00:20

非常好,但是只有测试集。文本是GBK编码的

码姐姐匿名网友 2019-04-27 00:00:20

非常不错的资源,很不错

码姐姐匿名网友 2019-04-27 00:00:20

还不错很好的资源

码姐姐匿名网友 2019-04-27 00:00:20

挺好的资源

码姐姐匿名网友 2019-04-27 00:00:20

不错不错不错不错不错