1. 首页
  2. 编程语言
  3. Java
  4. 全文索引引擎Lucene简单教程

全文索引引擎Lucene简单教程

上传者: 2019-01-20 09:12:23上传 PPTX文件 288.36KB 热度 54次
开源的全文索引引擎Lucene简单教程。Lucene自带了几个分词器WhitespaceAnalyzer, SimpleAnalyzer, StopAnalyzer, StandardAnalyzer, ChineseAnalyzer, CJKAnalyzer等。前面三个只适用于英文分词,StandardAnalyzer对可最简单地实现中文分词,即二分法,每个字都作为一个词,这样分出来虽然全面,但有很多缺点,比如,索引文件过大,检索时速度慢等。ChineseAnalyzer是按字分的,与StandardAnalyzer对中文的分词没有大的区别。 CJKAnalyzer是按两字切分的, 比较武断
用户评论