基于Java的搜索引擎Nutch中文搜索技术研究 上传者:ccfjmn 2019-07-20 00:27:53上传 TXT文件 12.04KB 热度 58次 基于Java的搜索引擎Nutch中文搜索技术研究摘要:Nutch是一个优秀的基于Java的开放源码搜索引擎,为了使它能够支持中文搜索,本文在分析了Nutch结构的基础上,采用词表分词技术和前向匹配分词算法对中文信息进行分词,以JavaCC脚本实现上下文相关文法中文分析模块,成功实现了Nutch中文搜索功能。关键词:搜索引擎;分词;正规 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论