1. 首页
  2. 信息化
  3. 企业管理
  4. GATE中文自然语言处理系列之三

GATE中文自然语言处理系列之三

上传者: 2018-12-20 08:59:58上传 DOCX文件 163.2KB 热度 27次
中文分句也是自然语言处理的基础之一,一般来说,中文中每个句子都表达了一个完整的意思。GATE的ANNIE提供了一个ANNIE Sentence Split资源,可以用于划分英文句子,但对中文的划分效果很不好(整篇文章分成了一个句子)。 GATE提供了两种句子划分的方法:基于JAPE规则和基于正则表达式,分别对应于类gate.creole.splitter. SentenceSplitter和gate.creole.splitter.RegexSentenceSplitter。本文先来讲述如何基于JAPE规则进行中文句子划分
用户评论