随笔 - 17  文章 - 84  trackbacks - 0
<2007年9月>
2627282930311
2345678
9101112131415
16171819202122
23242526272829
30123456

如非特别说明,所有文章均为原创。如需引用,请注明出处
Email:liangtianyu@gmail.com
MSN:terry.liangtianyu@hotmail.com

常用链接

留言簿(4)

随笔分类(12)

随笔档案(17)

最新随笔

搜索

  •  

积分与排名

  • 积分 - 51257
  • 排名 - 961

最新评论

阅读排行榜

评论排行榜

经过大半个月的努力,终于完成了Lucene.Net 2.1版本的改造。经测试可以完全兼容Java版,生成的索引文件与Java版的完全一样,查询效率很高,不过建立索引的效率相对很低。当然,下一步我会针对相关问题进行改进。

segment:代表一个完整的索引段
.fnm:Document中所有Field的信息,在FieldInfos中写入
.fdt:存储具有Store.YES属性的Field的数据,包括:数量,编号和长度
.fdx:存储Document在.fdt中的位置
.tis:存储分词后的词条(Term)
.tii:tis文件的索引文件,表明了每个tis文件中的词条的位置
.cfs:复合索引文件。建立索引时假如采取符合模式,则以上所有文件都回存储在.cfs文件中
posted on 2007-06-08 08:07 Terry Liang 阅读(2071) 评论(2)  编辑  收藏 所属分类: Lucene 2.1研究

FeedBack:
# re: Lucene 2.1研究:索引文件格式说明 2007-09-20 11:59 cd
怎么才能查看cfs文件的内容,想知道到底做了哪些索引.  回复  更多评论
  
# re: Lucene 2.1研究:索引文件格式说明 2007-09-20 12:04 Terry Liang
@cd
用UtraEdit或其他文本编辑器,已二进制文件打开就可以。具体格式定义我在其他文章里有详细说明。  回复  更多评论
  

只有注册用户登录后才能发表评论。


网站导航: