已预处理NLP英文语料库新闻组20_Newsgroup(单标签英文平衡语料)
已做预处理:分词、剔除停用词可直接拿来统计建立文本模型
下载地址
用户评论
数据处理得还不错,为我省下了大量的时间。就是规模小了点,再大点就好了。
为什么每个类别只有500左右的文档 不全啊 想知道怎么预处理的
还不错,这数据
还可以吧,不错的数据
很不错啊 啊啊
还是可以的
很有用,谢谢分享!
节约了很多预处理的精力
形成了一堆词表示文件,还可以
非常好,解决了我的燃眉之急