Skynet  
日历
<2009年3月>
22232425262728
1234567
891011121314
15161718192021
22232425262728
2930311234
统计
  • 随笔 - 112
  • 文章 - 1
  • 评论 - 40
  • 引用 - 0

导航

常用链接

留言簿(11)

随笔分类

随笔档案

相册

搜索

  •  

最新评论

阅读排行榜

评论排行榜

 
      各位“蜘蛛侠”们大家可能在抓取页面中的验证码而耿耿于怀,关于这点我想我目前可能能帮助下大家,在python中找到最接近与“杀手级别”的工具(源于开源,报与开源,好东西不干独享)。


调下大家的积极性 ,上图



python 包>> pytesser| http://code.google.com/p/pytesser/(其实 py包 使用很简单的,关键在安装)
1. 首先安装 pil : easy_install --find-links http://www.pythonware.com/products/pil/ Imaging
2. pytesser 依赖包 tesseract-ocrhttp://code.google.com/p/tesseract-ocr/  
             tesseract-ocr 依赖库| http://tesseract-ocr.googlecode.com/files/tesseract-2.00.eng.tar.gz 解压到 你安装的 tesseract-ocr 的 识别学习库下



整理 www.blogjava.net/Good-Game
posted on 2009-03-27 10:21 刘凯毅 阅读(2343) 评论(3)  编辑  收藏 所属分类: pythonimage
评论:
  • # re: 验证码识别(2)  ......... Posted @ 2009-03-27 15:31
    这个不错.不知道复杂的图片识别怎么样?  回复  更多评论   

  • # re: 验证码识别(2)  hwx Posted @ 2009-03-27 17:13
    还行哦,虽然识别码简单。我以前公司要用这些都是找人买的  回复  更多评论   

  • # re: 验证码识别(2)  wangdong Posted @ 2009-07-11 09:41
    呵呵,复杂的图片可以进行前端处理,比如二值化,中值滤波等等,处理成黑白的图片后再交给tesseract识别,不过对于背景色和字符色差不多的那种处理要麻烦一些  回复  更多评论   


专题:Android  iPad  jQuery  Chrome OS

博客园首页  IT新闻  知识库  学英语  Java程序员招聘
标题  
姓名  
主页
验证码 *  
内容(请不要发表任何与政治相关的内容)  
  登录      
每天10分钟,轻松学英语


网站导航:
 
 
Copyright © 刘凯毅 Powered by: 博客园 模板提供:沪江博客