1. 首页
  2. 编程语言
  3. 其他
  4. NLP文本分类语料库(复旦)训练集

NLP文本分类语料库(复旦)训练集

上传者: 2019-05-31 12:27:51上传 ZIP文件 52.56MB 热度 75次
由复旦大学李荣陆提供。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。train.zip为训练语料,共9804篇文档,分为20个类别。answer.zip为训练语料,共9833篇文档,同为20个类别。训练语料与测试语料基本按照1:1的比例来划分
用户评论
码姐姐匿名网友 2019-05-31 12:27:51

挺好的,标注完善

码姐姐匿名网友 2019-05-31 12:27:51

没下载成功,再来一次

码姐姐匿名网友 2019-05-31 12:27:51

非常好,但是只有训练集。文本是GBK编码的

码姐姐匿名网友 2019-05-31 12:27:51

没成功,再试一次

码姐姐匿名网友 2019-05-31 12:27:51

没下载成功,再试一次

码姐姐匿名网友 2019-05-31 12:27:51

还不错,感谢分享

码姐姐匿名网友 2019-05-31 12:27:51

还行,我没下下来,再试试

码姐姐匿名网友 2019-05-31 12:27:51

有点旧了就是

码姐姐匿名网友 2019-05-31 12:27:51

还不错,就是不是新的了

码姐姐匿名网友 2019-05-31 12:27:51

我以为是语音呢,结果是txt