叶明的javablog

java学习天堂,个人关于其他blog:blog.javaworker.cn,欢迎大家访问
posts - 64, comments - 50, trackbacks - 0, articles - 3

Lucene(2.4.1)技术研究(2)--分析事例

Posted on 2009-03-27 17:54 天空苍茫 阅读(1459) 评论(0)  编辑  收藏 所属分类: java知识eclipse
1、我们去分析一下该段程序。

a) 首先我们创建一个类IndexWriter,该类是lucene创建索引的核心,其主要功能是将所有的数据源所有内容,经过分词处理,创建成索引格式的文件(同数据库想对比,一个索引文件就相当一张表)

b) 然后,我们定义了document类。Lucene是将所有的数据源都转换成Document类型的文件,lucene内部只能识别出Document类型的文件。(同数据库相比的话,Document就像一个表的每一条记录。)

c) 然后我们定义了一些File类,其中File是作为真实的数据存储使用,每一个需要索引的内容都对应一个Filed,(和数据库相比,Field就相当一一条记录的一个属性与其值)。

d) 然后将Field增加到Document中,其中每个Document可以增加到多个Field对象。然后将所有的Doc交给IndexWriter去创建索引,创建完成后,如图一


图一 lucene索引后的文件

E)
然后开始查询,首先使用IndexReader来读取所创建目录下的索引文件,然后创建一个IndexSearch对象,该对象主要功能就是从索引中查询。

F)
然后定义查询策略,本例中采用queryParse来查询,然后循环,将所有查询的结果打印出来。

只有注册用户登录后才能发表评论。


网站导航: