全文检索技术(一):Lucene入门
一、全文检索的简介 1、全文检索的介绍 1.1、数据分类 结构化数据:格式固定、长度固定、数据类型固定,如:数据库数据。 非结构化数据:格式不固定、长度不固定、数据类型不固定,如:word文档、pdf文档、邮件、html、txt等。 1.2、数据的查询 结构化数据的查询:SQL语句,查询结构化数据的方法。简单、速度快。 非结构化数据的查询:需要先把非结构化数据转化为结构化数据,并创建索引,然后查询索引找到对应的数据。 索引:一个为了提高查询速度,创建某种数据结构的集合。 1.3、全文检索 先创建索引然后查询索引的过程叫做全文索引。 索引一次创建可以多次使用,表现为每次查询速度很快。 2
用户评论