随笔-28  评论-51  文章-10  trackbacks-0

 

各种检索系统介绍

Smart

免费,开源(基于向量空间模型的文本信息检索系统,文档支持不佳,500m以下)

 

 

Okapi系统

不免费,不提供源码,

 

基于概率检索模型

 

 

Lemur Toolkit系统

 

Free,开源,c/c++,

完整的检索系统,也是toolkit,加入语言模型,文档,代码支持良好

 

 

Lucene/nutch

索引/这里解释很详细

编码和索引结构

Delta编码

Vint

 

 

技术热点

自然语言

 

概念/LSI

 

用户模型

 

 

[各种技术的混合]

 

索引

各种建立索引的数据结构HASHB+树,R树。。。。。

 

 

这一部分,重点介绍了现成的几个应用系统,特别是luence,还有建立索引的各种数据结构。其中,关于热点部分,可以重点关注下,对自己的研究方向有些指导作用。
/Files/fullfocus/03.pdf

posted on 2008-06-16 23:47 fullfocus 阅读(1461) 评论(1)  编辑  收藏 所属分类: 聚类算法研究

评论:
# re: 北大ppt 文本挖掘技术系列之三---TextMining03-检索part2 2008-06-17 08:50 | mac521
lz,这篇的ppt怎么没有?  回复  更多评论
  

只有注册用户登录后才能发表评论。


网站导航: