基于自然语言的中文地址匹配研究
针对当前在电力中文地址匹配中存在部分地址歧义的问题,结合自然语言处理的基本原理,提出一种基于贝叶斯算法的中文地址精确匹配方法。为实现该方法,采用贝叶斯算法对中文字符串要素进行切分,以提高地址匹配的精度;采用句法分析,完成对中文地址的层级排序;采用语义标注,完成中文地址的匹配。最后,以上海电力局的部分中文地址数据为样本,采用上述方法进行划分,得到完整和准确的中文地址,并且在不同规模语料库下,本方法得到的分类正确率都在80%以上,具有较高的匹配精度。
下载地址
用户评论