Dedian  
-- 关注搜索引擎的开发
日历
<2006年5月>
30123456
78910111213
14151617181920
21222324252627
28293031123
45678910
统计
  • 随笔 - 82
  • 文章 - 2
  • 评论 - 228
  • 引用 - 0

导航

常用链接

留言簿(8)

随笔分类(45)

随笔档案(82)

文章档案(2)

Java Spaces

搜索

  •  

积分与排名

  • 积分 - 64138
  • 排名 - 816

最新评论

阅读排行榜

评论排行榜

 

The behavior of a web crawler is the outcome of a combination of policies:

  • A selection policy that states which pages to download.
  • A re-visit policy that states when to check for changes to the pages.
  • A politeness policy that states how to avoid overloading websites.
  • A parallelization policy that states how to coordinate distributed web crawlers.

cite from:

http://en.wikipedia.org/wiki/Web_crawler
posted on 2006-05-18 06:34 Dedian 阅读(175) 评论(0)  编辑  收藏

只有注册用户登录后才能发表评论。


网站导航:
 
 
Copyright © Dedian Powered by: 博客园 模板提供:沪江博客