1. 首页
  2. 行业
  3. 互联网
  4. 基于角色标注的中国人名自动识别研究

基于角色标注的中国人名自动识别研究

上传者: 2020-01-04 19:30:27上传 PDF文件 429KB 热度 56次
 该文提出了一种基于角色标注的中国人名自动识别方法.其基本思想是:根据在人名识别中的作用,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别.识别过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率.该方法的实用性还在于:这些角色信息完全可以从真实语料库中自动抽取得到.通过对16M字节真实语料库的封闭与开放测试,该方法取得了接近98%的召回率.文中介绍了计算所汉语词法分析系统ICTCLAS,集成人名识别算法之后,词法分析的准确率提高了1.41%,同时人名识别的综合指标F21值达到了9
下载地址
用户评论
码姐姐匿名网友 2020-01-04 19:30:27

理解ICTCLAS必读文章 可参考http://blog.csdn.net/DanceFire/archive/2007/05/13/1606603.aspx帮助共同理解ICTCLAS开源代码的人名识别部分