1. 首页
  2. 课程学习
  3. Java
  4. 情感分析酒店评论数据集合

情感分析酒店评论数据集合

上传者: 2023-08-28 23:31:12上传 RAR文件 3.81MB 热度 47次

为了解决国内中文情感分析领域缺乏语料的问题,谭松波收集整理了一个规模较大的酒店评论语料库。该语料库包含10000篇文本,采集自携程网,并经过精心整理。为了方便使用,语料库被划分为4个子集,分别是:ChnSentiCorp-Htl-ba-2000、ChnSentiCorp-Htl-ba-4000、ChnSentiCorp-Htl-ba-6000以及ChnSentiCorp-Htl-unba-10000。其中,平衡语料包括正负类各自1000篇、2000篇和3000篇,而非平衡语料共有7000篇正类评论。这个语料库的建立将有助于加强中文情感分析相关研究的开展。

用户评论