SMP2020微博情绪分类技术评测数据集
SMP2020微博情绪分类技术评测数据集本次技术评测使用的标注数据集由哈尔滨工业大学社会计算与信息检索研究中心提供原始数据源于新浪微博由微热点大数据研究院提供数据集分为两部分. 第一部分为通用微博数据集该数据集内的微博内容是随机获取到微博内容不针对特定的话题覆盖的范围较广. 第二部分为疫情微博数据集该数据集内的微博内容是在疫情期间使用相关关键字筛选获得的疫情微博其内容与新冠疫情相关. 因此本次评测训练集包含上述两类数据通用微博训练数据和疫情微博训练数据相对应的测试集也分为通用微博测试集和疫情微博测试集.参赛成员可以同时使用两种训练数据集来训练模型. 每条微博被标注为以下六个类别之一neutral无情绪happy积极angry愤怒sad悲伤fear恐惧surprise惊奇. 通用微博训练数据集包括27768条微博验证集包含2000条微博测试数据集包含5000条微博. 疫情微博训练数据集包括8606条微博验证集包含2000条微博测试数据集包含3000
用户评论