中文人名自动识别的一种有效方法
中文信息计算机自动处理的研究已有几十年的历史,但至今仍有许多技术难题没有得到很好解决,中文姓名自动识别问题就是其中的一个。由于它与中文文本的自动分词一样,属于中文信息处理的基础研究领域,因而它的研究成果直接影响到中文信息的深层次研究。汉语的自身特点使得中文信息自动处理大多是先对要处理的文本进行自动分词(加入显式分割符),然后再在分词的基础上进行词法、语法、语义等方面的深入分析。而在分词阶段,文本中的人名、地名以及其它专有名词和生词大多被切分成单字词,在这种情形下如不能很好地解决汉语文本中专有名词生词的识别问题,将给其后的汉语文本的深入分析带来难以逾越的障碍。中文姓名的自动识别问题就是在这种背景下提出来
用户评论
自然语言理解课程考试用上了,谢谢分享
可以借鉴一下,但效果未知