华剑论山
一般一般,全球第三

我的评论

re: 搭建基于Nutch1.0的搜索引擎说明文档[未登录] 老谢 2010-11-23 22:45  
环境:windows+cygwin(用于模拟unix系统)+nutch1.0

要用于生产环境。


当我抓取完网页以后,启动tomcat,输入关键字搜索网页后,那么我再次运行nutch抓取网页的时候就会报错!
当我把tomcat关闭以后抓取网页就没有任何问题。后来我仔细查了一下是因为tomcat启动后占用了nutch的索引文件而没有释放资源造成的。 也就是说在tomcat启动的时候,nutch是不能抓取网站合并索引的。

在生产环境下,要求每一个小时就要增量抓取一次,我总不能把tomcat关了吧。
请回到我的邮箱里吧:xieyunchaobest@gmail.com

在生产环境下,这个问题应该怎么解决呢?
re: 搭建基于Nutch1.0的搜索引擎说明文档[未登录] 老谢 2010-11-23 22:44  
环境:windows+cygwin(用于模拟unix系统)+nutch1.0

要用于生产环境。


当我抓取完网页以后,启动tomcat,输入关键字搜索网页后,那么我再次运行nutch抓取网页的时候就会报错!
当我把tomcat关闭以后抓取网页就没有任何问题。后来我仔细查了一下是因为tomcat启动后占用了nutch的索引文件而没有释放资源造成的。 也就是说在tomcat启动的时候,nutch是不能抓取网站合并索引的。

在生产环境下,要求每一个小时就要增量抓取一次,我总不能把tomcat关了吧。

在生产环境下,这个问题应该怎么解决呢?
 
<2025年7月>
日一二三四五六
293012345
6789101112
13141516171819
20212223242526
272829303112
3456789

 导航

  • BlogJava
  • 首页
  • 发新随笔
  • 发新文章
  • 联系
  • 聚合
  • 管理

 统计

  • 随笔: 1
  • 文章: 0
  • 评论: 0
  • 引用: 0

常用链接

  • 我的随笔
  • 我的评论
  • 我的参与

留言簿(1)

  • 给我留言
  • 查看公开留言
  • 查看私人留言

随笔分类(1)

  • 配置管理(1) (rss)

随笔档案(1)

  • 2005年10月 (1)

搜索

  •  

最新评论


Powered by: 博客园
模板提供:沪江博客
Copyright ©2025 老谢