搜狗分类语料库精简版1
文本分类语料库来源于Sohu新闻网站保存的大量经过编辑手工整理与分类的新闻语料与对应的分类信息。其分类体系包括几十个分类节点,网页规模约为十万篇文档。语料库统计的意义:提供一个较大规模的标准中文文本分类测试平台。应用案例:中文文本分类,主题跟踪与检测等。
下载地址
用户评论
这个是搜狗语料库9类文本里的前5类,和UP主后面那个精简2凑合起来就是完整的9类
不错,真是迷你滴。
挺好的,适合做中文分词的材料
非常好,用着挺方便。
还可以,适合分词。
适合做中文分词的材料
很整齐的语料库 适合做中文分词的材料