中文情感分析酒店评论预料
为了弥补国内在中文情感挖掘方面的语料的匮乏,谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集:1.ChnSentiCorp-Htl-ba-2000:平衡语料,正负类各1000篇。2.ChnSentiCorp-Htl-ba-4000:平衡语料,正负类各2000篇。3.ChnSentiCorp-Htl-ba-6000:平衡语料,正负类各3000篇。4.ChnSentiCorp-Htl-unba-10000:非平衡语料,正类为7000篇。
下载地址
用户评论
挺好的,数据也还行
很好的资源,受用,谢谢!
感谢分享。正好能用上
还没用过,初略看了一下,感觉还可以
主要是里面的文件格式不一样,不知道是不是故意的
很不多的资料
还可以,比较全面
感觉还可以
整理的不错
感谢分享, 别的地方都无法下载了