1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于词序列频率有向网的中文组合词提取算法.pdf

论文研究基于词序列频率有向网的中文组合词提取算法.pdf

上传者: 2020-06-07 14:05:30上传 PDF文件 236.06KB 热度 20次
随着人类知识体系的不断拓展和深化,很多组合词(多个词或语素组成的词)被创造出来用于表达新的概念。由于无法及时把组合词收录进词库,分词系统无法识别它们。为此,从文本中提取组合词成为智能计算领域的一个热门的研究方向。借鉴人类的认知心理模式,提出一种基于词序列频率有向网的组合词抽取算法,以识别自由文本中的组合词。算法首先建立描述文本中的词序列出现频率的有向网,然后通过独特的矩阵运算,逐步把组合词提取出来。算法的优点是无须借助专业的语言知识,在实验分析中,算法显示了较好的效果。
下载地址
用户评论