1. 首页
  2. 课程学习
  3. 数据库
  4. 中文社交媒体情感分类数据库

中文社交媒体情感分类数据库

上传者: 2023-12-03 09:27:17上传 ZIP文件 1.73MB 热度 61次

中文社交媒体情感分类数据库是一个包含情感标注的微博语料库,包含10000条训练数据和500条测试数据。每条语料以微博的唯一标识mid开头,可通过链接访问微博网页(部分微博可能已被删除)。情感标签使用0表示负面情感,1表示正面情感。微博文本中的表情和特殊格式都经过转义处理,如表情被标记为[xx]或[允悲],话题、地理位置、视频和文本超链接等被转义成{%xxxx%}的格式,方便使用正则表达式进行数据清洗。

下载地址
用户评论