淡蓝色的轨迹……
天很高,云很淡 风很轻,海很蓝
牵着手
在浪漫的沙滩上,留下两行清晰的脚印......
BlogJava
首页
新随笔
新文章
联系
聚合
管理
posts - 20,comments - 72,trackbacks - 0
<
2007年6月
>
日
一
二
三
四
五
六
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
2
3
4
5
6
7
常用链接
我的随笔
我的文章
我的评论
我的参与
最新评论
留言簿
(12)
给我留言
查看公开留言
查看私人留言
随笔分类
(8)
一起的日子
学习 . 感悟(8)
这就是生活......
随笔档案
(20)
2008年4月 (1)
2008年3月 (2)
2007年11月 (1)
2006年10月 (1)
2006年9月 (1)
2006年8月 (1)
2006年6月 (1)
2006年5月 (1)
2006年3月 (2)
2006年2月 (5)
2005年12月 (2)
2005年11月 (1)
2005年10月 (1)
文章分类
(18)
它山之石(15)
技术生涯(3)
文章档案
(19)
2008年3月 (1)
2005年10月 (18)
收藏夹
java技术
正则表达式
Space
张老大的Blob
最新随笔
1. 不要重新发明轮子?
2. 一个关于分页的数据和显示分离的设计
3. Cron表达式【转】
4. IE存储空间不足错误的终极解决方案
5. 继续努力……
6. snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
7. 猫扑电台遨游插件
8. snoics-reptile中的snoics-systemconfig.xml的CSDN中Java文档中心的抓取配置
9. 源代码发布 snoics-reptile 网页爬虫2.0
10. snoics-reptile 网页爬虫2.0
11. 框架.....
12. 捕获控制台的所有输出信息
13. OpenCMS V6.03 + Oracle92 的中文版完整安装过程
14. 自己实现的一个加密算法
15. 关于权限模块的设想
16. 比较完整全面的分页
17. 自己用java做的一个类似网页爬虫的东西
18. 在spring中使用代理摸板进行配置
19. Hibernate处理继承关系
20. 取得当前执行程序使用的classpath
搜索
积分与排名
积分 - 24809
排名 - 323
最新评论
1. re: OpenCMS V6.03 + Oracle92 的中文版完整安装过程[未登录]
按照你的方法opencms汉化完成了,谢谢哈!
不过这个汉化包好像只部分汉化了。
--robin
2. re: 自己用java做的一个类似网页爬虫的东西
挺不错。
有没有源码提供啊。
学习一下。
kqy929@126.com
谢谢了~~
--老匡
3. re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
能不能出份教程啊。要不你的搞得这个也浪费了,好多人想用都不会用。
--xmf
4. re: 源代码发布 snoics-reptile 网页爬虫2.0
请问能不能出套教程。
--fgfd
5. re: 自己用java做的一个类似网页爬虫的东西
支持一下,
--外星飞碟
阅读排行榜
1. 比较完整全面的分页(2393)
2. 源代码发布 snoics-reptile 网页爬虫2.0 (2079)
3. snoics-reptile 网页爬虫2.1 (2006-10-27日更新)(1684)
4. IE存储空间不足错误的终极解决方案(1490)
5. snoics-reptile 网页爬虫2.0(1490)
评论排行榜
1. 自己用java做的一个类似网页爬虫的东西(11)
2. snoics-reptile 网页爬虫2.1 (2006-10-27日更新)(11)
3. 源代码发布 snoics-reptile 网页爬虫2.0 (9)
4. OpenCMS V6.03 + Oracle92 的中文版完整安装过程(9)
5. 捕获控制台的所有输出信息(7)
snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
最近因为工作太忙的原因,一直没有时间来更新,现在放出2.1的版本(包含最新的源代码)。
下载地址:
snoics-reptile2.1.part1.rar
snoics-reptile2.1.part2.rar
snoics-reptile2.1.part3.rar
snoics-reptile2.1.part4.rar
(大家有什么意见可以在这里提出,只要有时间,我会尽量更新,有什么建议可以在blog里面提出,或者加我的MSN一起讨论。 ^_^ )
版本历史
2.1:
1、不用再配置snoics-configpath.xml中的路径。
2、定时自动保存Cache
3、修改了一些Bug
2.0:
核心代码全部重写,增加了扩展性,通过扩展之后,基本上能实现对整个网站完整的解析
1.0:
实现了整站抓取的基本的功能,不能解析特殊的URL,对javascript无法辨认
posted on 2006-10-27 21:05
snoics
阅读(1684)
评论(11)
编辑
收藏
FeedBack:
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2006-10-27 22:35 |
weidagang2046
有没有文档之类的?
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2006-10-31 15:59 |
捕风
只能抓起静态页面吗?
存不存在防火墙穿越不了的问题?
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2006-12-14 13:47 |
叶建辉
snoics.jar 的原代码好象没有?yejianhui425@126.com
yejianhui423@hotmail.com 您的MSN是多少?
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2007-04-21 18:56 |
zx
好像缺少com.snoics.base和com.snoics.useclass的代码
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2007-05-09 14:45 |
游客
局域网内可以使用吗?
支持NTLM域认证吗?
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2007-06-14 09:51 |
雨夜
不行哦,怎么还是报MAIN的意外错误,请麻烦给解释下,问题出在哪,RUN.BAT文件也没有JAR名字的错误哦,谢谢!
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2007-07-12 21:10 |
杨铸
最新版本怎么使用他啊,谢谢,
需要注意那些问题!
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2007-08-01 23:30 |
ava
new
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2008-01-25 09:51 |
xiao
还有没有最新版本.老大,能加msn吗.xrb2008@hotmail.com
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2008-03-26 15:27 |
动
能指导一下这东西怎么用嘛
回复
更多评论
#
re: snoics-reptile 网页爬虫2.1 (2006-10-27日更新)
2008-07-07 13:27 |
xmf
能不能出份教程啊。要不你的搞得这个也浪费了,好多人想用都不会用。
回复
更多评论
新闻频道
新用户注册
刷新评论列表
标题
姓名
主页
验证码
*
内容(请不要发表任何与政治相关的内容)
Remember Me?
登录
使用高级评论
新用户注册
返回页首
恢复上次提交
[使用Ctrl+Enter键可以直接提交]
该文被作者在 2006-10-27 21:12 编辑过
博客园
BlogJava
博客生活
IT博客网
C++博客
PHP博客
博客园社区
管理博客
教师博客
天文博客
汽车博客
足球博客
股票博客
电子博客
管理