1. 首页
  2. 编程语言
  3. 其他
  4. 基于隐马模型的中国人名自动识别研究

基于隐马模型的中国人名自动识别研究

上传者: 2018-12-18 16:10:49上传 DOC文件 86.5KB 热度 37次
中国人名的识别是中文未登录词识别的重点和难点,目前的解决方案自身存在一些本质的缺陷,实际效果还难以满足实际需求。本文提出了一种基于角色标注的中国人名自动识别方法。即:利用从语料库中自动抽取的角色信息,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别。通过对16M字节真实语料库的封闭与开放测试,该方法取得了接近98%的召回率,准确率也得到了实际提高。实验数据证明:该方法是行之有效、能够成功解决中国人名的自动识别问题。
下载地址
用户评论