1. 首页
  2. 编程语言
  3. C++ 
  4. 中文突发事件语料库 CEC Corpus.zip

中文突发事件语料库 CEC Corpus.zip

上传者: 2020-10-07 06:12:53上传 ZIP文件 824.94KB 热度 15次
中文突发事件语料库是由上海大学(语义智能实验室)所构建。根据国务院颁布的《国家突发公共事件总体应急预案》的分类体系,从互联网上收集了5类(地震、火灾、交通事故、恐怖袭击和食物中毒)突发事件的新闻报道作为生语料,然后再对生语料进行文本预处理、文本分析、事件标注以及一致性检查等处理,最后将标注结果保存到语料库中,CEC合计332篇。
用户评论