|   各种检索系统介绍 | Smart | 免费,开源(基于向量空间模型的文本信息检索系统,文档支持不佳,500m以下) | 
        
            |   |   Okapi系统 | 不免费,不提供源码,   基于概率检索模型   | 
        
            |   | Lemur Toolkit系统   | Free,开源,c/c++, 完整的检索系统,也是toolkit,加入语言模型,文档,代码支持良好 | 
        
            |   |   Lucene/nutch | 索引/这里解释很详细 | 
        
            | 编码和索引结构 | Delta编码 Vint等 |   | 
        
            |   技术热点 | 自然语言 |   | 
        
            | 概念/LSI |   | 
        
            | 用户模型 |   | 
        
            |   | [各种技术的混合] |   | 
        
            | 索引 | 各种建立索引的数据结构HASH,B+树,R树。。。。。 |   | 
    
 
这一部分,重点介绍了现成的几个应用系统,特别是luence,还有建立索引的各种数据结构。其中,关于热点部分,可以重点关注下,对自己的研究方向有些指导作用。
/Files/fullfocus/03.pdf
	posted on 2008-06-16 23:47 
fullfocus 阅读(1495) 
评论(1)  编辑  收藏  所属分类: 
聚类算法研究