当前位置: 首页 > article >正文

爬虫案例-亚马逊验证码突破

在github上看到了AmazonCaptcha这个第三方库,过亚马逊验证码是真的好用,使用也非常简单。

#pip 安装
pip install amazoncaptcha

获取到验证码图片连接可以下载本地,然后直接传入保存的路径:

from amazoncaptcha import AmazonCaptcha

captcha = AmazonCaptcha(文件保存路径)
solution = captcha.solve() #识别后返回的结果,字符型

也可以不下载下来,直接传入验证码图片连接:

from amazoncaptcha import AmazonCaptcha

link = 获取到的验证码图片链接
# 测试示例
#link = 'https://images-na.ssl-images-amazon.com/captcha/usvmgloq/Captcha_kwrrnqwkph.jpg'

captcha = AmazonCaptcha.fromlink(link)
solution = captcha.solve()#识别后返回的结果,字符型

如果是用selenium采集的话,更方便。只要在验证码页面停留一会儿,调用AmazonCaptcha.fromdriver()方法 ,可以直接获取到验证码的识别后的结果。下面是示例:

from amazoncaptcha import AmazonCaptcha
from selenium import webdriver

driver = webdriver.Chrome() 
driver.get('https://www.amazon.com/errors/validateCaptcha')

captcha = AmazonCaptcha.fromdriver(driver)
solution = captcha.solve()#识别后返回的结果,字符型


实测到目前为止准确率96%多, 而且响应很快,并发也可以完美处理。

参考链接:github地址

https://github.com/a-maliarov/amazoncaptcha

http://www.kler.cn/a/413465.html

相关文章:

  • idea初始化设置
  • 《进程隔离机制:C++多进程编程安全的坚固堡垒》
  • 【含开题报告+文档+PPT+源码】基于SSM的电影数据挖掘与分析可视化系统设计与实现
  • 水库大坝安全监测之量水堰计应用
  • Android 13 Aosp Settings Android Studio版本
  • 树莓派搭建NextCloud:给数据一个安全的家
  • 如何为 XFS 文件系统的 /dev/centos/root 增加 800G 空间
  • vue实现滚动条滑动到底部分页调取后端接口加载数据
  • JS小模块练习
  • 【Python】 深入理解Python的单元测试:用unittest和pytest进行测试驱动开发
  • Oracle RMAN异机迁移数据库从文件系统至ASM
  • ffmpeg命令详解
  • 《黑神话:悟空》获TGA 2024四项提名,动作捕捉与人脸建模技术如何续写中国游戏新神话?
  • 什么是Web Worker?如何使用Web Worker?
  • Linux系統中修改IP地址詳細教程
  • Elasticseach黑马笔记
  • 【设计模式】【创建型模式(Creational Patterns)】之建造者模式(Builder Pattern)
  • AI助力PPT创作:从手动到智能,打造高效演示
  • 比特币libsecp256k1中safegcd算法形式化验证完成
  • Java基于SSM框架的校园综合服务小程序【附源码、文档】