1. 首页
  2. 数据库
  3. 其它
  4. 基于互信息的维吾尔文自适应组词算法

基于互信息的维吾尔文自适应组词算法

上传者: 2021-02-09 20:32:09上传 PDF文件 1.37MB 热度 9次
传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度的度量,实现了基于分段式策略和增量式策略的两种自适应组词算法,并与传统的分词方法得到的词汇表进行对比分析。实验结果表明,组词算法能够非常有效地提取文本中的语义词,两种算法在大规模文本集上的组词准确率分别达到了84.31%和88.24%。
下载地址
用户评论