1. 首页
  2. 编程语言
  3. Java
  4. Lucene的中文分词方法设计与实现

Lucene的中文分词方法设计与实现

上传者: 2019-09-09 11:32:27上传 PDF文件 347.8KB 热度 40次
本文设计实现了一个中文分词模块,其主要研究目的在于寻找更为有效的中文词汇处理方法,提高全文检索系统的中文处理能力.整个模块基于当前最流行的搜索引擎架构Lucene,实现了带有歧义消除功能的正向最大匹配算法.在系统评测方面,比较了该方法与现有方法的区别,对于如何构建一个高效的中文检索系统,提出了一种实现.关键词:中文分词;搜索引擎;Lucene;正向最大匹配
用户评论