1. 首页
  2. 编程语言
  3. C
  4. 2008最新搜狗中文文本分类语料(最新最全)

2008最新搜狗中文文本分类语料(最新最全)

上传者: 2019-05-02 13:47:14上传 RAR文件 25.86MB 热度 37次
很全的中文文本分类语料库可以用于文本分类文本聚类C000007汽车C000008财经C000010ITC000013健康C000014体育C000016旅游C000020教育C000022招聘C000023文化C000024军事
用户评论
码姐姐匿名网友 2019-05-02 13:47:14

这只是一部分。

码姐姐匿名网友 2019-05-02 13:47:14

不全,要分太高了,建议直接去搜狗lab下载,那还有完全版的

码姐姐匿名网友 2019-05-02 13:47:14

挺全的,不错,很有用~~~

码姐姐匿名网友 2019-05-02 13:47:14

用来做测试集

码姐姐匿名网友 2019-05-02 13:47:14

文本还是比较全的,就是没有标注词性。

码姐姐匿名网友 2019-05-02 13:47:14

优点是有些有用的内容,就是不全,缺点是不太好用

码姐姐匿名网友 2019-05-02 13:47:14

一点都不全,只有一类军事文本,分还那么高,

码姐姐匿名网友 2019-05-02 13:47:14

做语义分析很有用,只是不够全。。