饶荣庆 -- 您今天UCWEB了吗?--http://www.ucweb.com

3G 手机开发网

   :: 首页 :: 联系 :: 聚合  :: 管理
  99 Posts :: 1 Stories :: 219 Comments :: 0 Trackbacks
最近要用到全文检索技术。
这个Lucene是个在java界有着很高声誉的全文检索包。
通过学习,自己对它算是有个初步了解。所以写下心得与经验跟朋友们分享。
对于整个网站的结构我说下我的看法
数据库+前端技术+后台处理技术。
上面的这些我就不说了。用来用去就是那几个,你觉得那个用的顺手就行了。

搜索引擎技术呢,我觉得要点是:
1。把我们分散的数据资源整合起来-----对应于Lucene的Index也就是索引的意思。
      我们把数据库的数据,按照自己的方式进行索引,关于索引的技术可以上网查看。这些索引的数据结构是可以自己定义的,这样方便查询。
2。搜索技术,因为我们的资源太分散了,就拿数据里面的资源来说吧,每个表都不同,里面的字段都不同,如果单纯采用数据库来做的话,你可能要写很多个api进行搜索。并对搜索结果进行出里,这样我们就要自己做很多事情。这么麻烦的话,我们何不把这些数据库里面的数据进行索呢,把我们需要的数据,归类,整理,然后保存到索引中,虽然这样会增加磁盘的容量,但我觉得这应该就不是问题。
      对于搜索技术,我们这里又要涉及到关于分词的技术,因为我们中文不同洋文,对分词技术的要求比较高。在这里,我也只是略微看了下Lucene的理论,具体实现,我也很模糊。如果分词分的好,对于搜索精度是有很大帮助的。

3。说实话索引就是一个数据库。他可以更新,删除,修改等。
先记录下这么多,以后在项目中实践的时候,继续说说我的理解
理解可能偏差比较大。大家不要被我误导啊。
不错的关于lucene英文书 点此下载


爬虫工作室 -- 专业的手机软件开发工作室
3G视线 -- 专注手机软件开发
posted on 2007-04-16 12:09 3G工作室 阅读(1416) 评论(2)  编辑  收藏 所属分类: 搜索引擎

Feedback

# re: Lucene学习一 2007-04-16 13:39 坏男孩
看看我做的全文检索在
http://www.sdjtcx.com
探路者搜索引擎!  回复  更多评论
  

# re: Lucene学习一 2007-04-18 08:40 开源英汉机器翻译
开源英汉机器翻译C#.NET项目 www.liebiao.net

我们邀请你 技术交流


..  回复  更多评论
  


只有注册用户登录后才能发表评论。


网站导航: