用于自然语言处理的语料库——新浪新闻
我自己写的新闻解析器从网页中提取的,支持多页新闻,效果不错。
下载地址
用户评论
比较老的, 但是还是齐全的, GBK编码
还可以,,就是有点少
有近几年的吗?带关键词的?
很不错的资源,解决了问题
内容全是text为分开的文本,如果自己需要短语句需要自己切分 不过还是不错了.
很全很丰富
不错,就是量还是比较少,最后还是自己爬的数据
不错的语料库,也就是论文上主要能用着,文本分类用。
不错,谢谢分享给大家
语料库内容不错,感谢分享,有再大的和新的新闻语料就更好了