Lucene Indexing 为实验语料库生成Lucene索引(AP89)
Lucene索引为实验语料库生成Lucene索引(AP89)使用Lucene创建索引。从Lucene的角度来看,每个文档都是预定义字段的集合,其中一个字段提供了一个字段名称和值。通过使用Lucene API(Java),我们可以很方便的生成语料索引(倒排索引),然后我们可以使用Lucene搜索API计算TF和IDF。Lucene索引有以下字段:1.DOCNO,2.HEAD(合并两个
),3. (合并两个),4., and 5.
下载地址
用户评论