1. 首页
  2. 数据库
  3. 其它
  4. 基于音节最大匹配的老挝分词方法

基于音节最大匹配的老挝分词方法

上传者: 2021-04-25 01:46:32上传 PDF文件 850.83KB 热度 10次
分词是语义分析,机器翻译,质量保证,知识图谱研究工作的重要支持,主要用于信息检索,文本处理,数据处理以及自然语言处理的许多其他领域。 因此,分词的实现是非常有意义的工作。 本文的方法是对老挝语文本语料库的音节进行分割,以实现最大的音节和字典匹配。 然后匹配分词和错误词典的结果,并通过错误词典更正一些错误的单词。 最后,我们使用正则表达式匹配分段结果中的相应单词字符串,并通过一些人工制定的老挝语字母,数字等规则来纠正错误的单词。 它可以提高老挝分词的效率和准确率。
用户评论