Posted on 2007-06-29 22:41 
天霁 阅读(1637) 
评论(13)  编辑  收藏  所属分类: 
nutch 
			
			
		 
		         好久没回来了,终于有时间可以更新这个小工具了。
         修改的地方:
         1、区分数据存储的实际目录;
         2、可以反复查询不同的目录数据;
         3、数据导出为CVS文件;
         4、其他一些小bug;
         5、修改status的表现内容
         在这里下载,下载后解压缩,两个解压缩文件:RedmuTool.jar,startup.bat,一个类包文件夹:lib。确认这三个在同一文件夹下。
       运行界面:

       
        主界面出现后,File-->open,选择nutch抓取后保存数据的文件夹:
 菜单中不同的选项对应不同的文件夹,点击相应的选择,就会看到相应的数据内容:
>

点击“ExportToCVS”,则把数据导入到指定的文件内:

对于被保存的页面内的内容“ParseText”和“Content”,处理不好,数据太长了,写到文本文件内表现实在太长了。
在使用中任何意见均可留言,或发送邮件到:
redmuer@hotmail.com。