1. 首页
  2. 移动开发
  3. 其他
  4. COAE2008 4K 文档

COAE2008 4K 文档

上传者: 2020-08-19 14:39:09上传 RAR文件 11.46MB 热度 15次
COAE2008数据集,4万篇中文文档.数据来源于一个语料分类比赛. 语料规模接近40000篇。其中至少包括4000余篇情感文本,这些情感文本均采用手工标注。参赛者只需下载压缩包并解压后即可使用。语料中大致含有两种编码:即GB2312,Unicode(UTF-8)编码。可以正常用写字板打开的是GB2312,显示为乱码的为Unicode(UTF-8)编码。
下载地址
用户评论