1. 首页
  2. 课程学习
  3. Java
  4. Lucene全文搜索引擎工具包压缩文件

Lucene全文搜索引擎工具包压缩文件

上传者: 2024-04-13 10:13:12上传 RAR文件 51.08MB 热度 4次

数据可分为两种类型:结构化数据和非结构化数据。结构化数据具有固定格式或有限长度,例如数据库和元数据。非结构化数据则是不定长或无固定格式的数据,如邮件和Word文档等磁盘上的文件。对结构化数据进行全文搜索相对简单,因为数据具有固定格式,例如可以使用SQL语句搜索数据库中的数据。而对于非结构化数据,则可采用顺序扫描法或全文搜索两种方法。顺序扫描法需要逐个文档地扫描内容,速度较慢。全文搜索则是将非结构化数据中的一部分信息提取出来,重新组织使其具有一定结构,然后进行搜索,以提高搜索速度。这部分从非结构化数据中提取并重新组织的信息称为索引。

下载地址
用户评论