Python爬虫破解滑动验证码教程
itomcoil 2025-04-27 14:18 13 浏览
破解滑动验证码通常需要结合图像识别和模拟人类操作,以下是分步骤的解决方案:
1. 分析验证码类型
- 缺口识别型:背景图带缺口,滑块图带凸块
- 轨迹验证型:除了位置还需模拟人类移动轨迹
2. 获取验证码图片
- 方法一:通过Selenium截图
python
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(url)
bg_element = driver.find_element_by_id("bg_img")
slide_element = driver.find_element_by_id("slide_img")
# 截图并裁剪
bg_element.screenshot('bg.png')
slide_element.screenshot('slide.png')
- 方法二:解析网络请求获取图片URL(需抓包分析)
3. 图像处理识别缺口位置
使用OpenCV进行模板匹配
python
import cv2
import numpy as np
def find_gap(bg_path, slide_path):
# 读取图片
bg = cv2.imread(bg_path) # 背景图
slide = cv2.imread(slide_path) # 滑块图
# 灰度化处理
bg_gray = cv2.cvtColor(bg, cv2.COLOR_BGR2GRAY)
slide_gray = cv2.cvtColor(slide, cv2.COLOR_BGR2GRAY)
# 边缘检测(可选)
bg_edge = cv2.Canny(bg_gray, 100, 200)
slide_edge = cv2.Canny(slide_gray, 100, 200)
# 模板匹配
res = cv2.matchTemplate(bg_edge, slide_edge, cv2.TM_CCOEFF_NORMED)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
# 返回缺口x坐标
return max_loc[0]
4. 计算移动轨迹
- 直接跳转会触发反爬,需模拟人类加速-减速过程
python
def generate_track(distance):
track = []
current = 0
mid = distance * 0.8
t = 0.2
while current < distance:
if current < mid:
a = 2 # 加速阶段
else:
a = -3 # 减速阶段
v = v0 + a*t
move = v0*t + 0.5*a*t**2
current += move
track.append(round(move))
v0 = v
return track
5. 执行拖动操作
使用Selenium模拟
python
from selenium.webdriver import ActionChains
slider = driver.find_element_by_id("slider")
# 生成轨迹
distance = find_gap("bg.png", "slide.png")
track = generate_track(distance)
# 拖动操作
ActionChains(driver).click_and_hold(slider).perform()
for x in track:
ActionChains(driver).move_by_offset(x, 0).perform()
ActionChains(driver).release().perform()
6. 高级反爬应对策略
- 轨迹检测:添加随机Y轴偏移
python
track.append((x, np.random.randint(-2,3)))
- Canvas指纹:使用无头浏览器(Puppeteer/Playwright)
- 参数加密:逆向JS分析加密逻辑
- 深度学习:使用YOLO等模型定位缺口
注意事项
- 合法合规:仅用于授权测试
- 代理IP:防止IP被封禁
- 请求间隔:添加随机等待时间
- 验证结果:检查是否返回成功Token
完整示例代码
python
# 需安装:selenium, opencv-python, numpy
import cv2
import numpy as np
from selenium import webdriver
from selenium.webdriver import ActionChains
def crack_slide_captcha():
driver = webdriver.Chrome()
driver.get("https://example.com/login")
# 获取验证码图片
bg = driver.find_element_by_id("bg-img")
slide = driver.find_element_by_id("slide-img")
bg.screenshot("bg.png")
slide.screenshot("slide.png")
# 计算缺口位置
gap_pos = find_gap("bg.png", "slide.png")
# 模拟拖动
slider = driver.find_element_by_id("slider")
track = generate_track(gap_pos)
ActionChains(driver).click_and_hold(slider).perform()
for x in track:
ActionChains(driver).move_by_offset(x, 0).perform()
ActionChains(driver).release().perform()
return driver.get_cookies()
对抗升级方案
- 使用Pyppeteer隐藏自动化特征
- 调用第三方打码平台(人工识别)
- 部署深度学习模型(需标注数据集)
实际应用中需根据目标网站的具体实现动态调整方案。
相关推荐
- Python 类型注解的进阶应用:从静态检查到元编程
-
阅读文章前辛苦您点下“关注”,方便讨论和分享,为了回馈您的支持,我将每日更新优质内容。如需转载请附上本文源链接!近年来,Python类型注解(TypeHinting)逐渐从一个可选的功能演变为大型...
- 高阶Python|返回类型提示技巧 (1)
-
引言Python提供了一种可选的特性——类型提示,它有助于提高代码的可读性、可推理性和可调试性。通过类型提示,开发者能够清楚地了解变量、函数参数和返回值应具备的数据类型。在开发那些需要高度灵活性的应用...
- 跟我一起学Python-函数的定义(基础)
-
一.函数的定义和调用1.语法:def函数名():函数封装的代码函数最好能够表达函数内部封装的代码功能,方便后续的调用,函数命名需要遵循规则字母、数字、下划线、不能以数字开头,不能使用系统关键字。...
- Python函数参数和返回值类型:让你的代码更清晰、更健壮
-
在Python开发中,你是否遇到过这些抓狂时刻?同事写的函数参数类型全靠猜调试两小时发现传了字符串给数值计算函数重构代码时不知道函数返回的是列表还是字典今天教你两招,彻底解决类型混乱问题!让你的...
- python入门到脱坑 函数—参数(python 参数处理)
-
本文包括必须参数,关键参数,默认参数以及可变参数Python函数参数详解一、位置参数(必需参数)位置参数是函数调用时必须提供的参数,且顺序必须与定义时一致。基本用法defgreet(name,me...
- python入门到脱坑经典案例—求两个数的和
-
下面为大家讲解如何求两个数之和——这是编程中最基础但最重要的算术运算之一。我们会从最简单的情况逐步深入,并穿插相关编程概念。1.最基础版本#定义两个变量num1=5num2=3#...
- 新手必看!30 个 Python 核心函数详解,手把手教你玩转编程
-
Python中30个核心函数及其含义、代码示例、注释和应用场景:print():用于输出文本或变量的值到控制台。message="Hello,World!"#定义一个...
- Python快速入门教程1:基本语法、数据类型、运算符、数字字符串
-
Python3的基础教程,涵盖了基本语法、数据类型、类型转换、解释器、注释、运算符、数字和字符串等内容,并附有使用实例场景。Python3的基础教程,涵盖了基本语法、数据类型、类型转换、解释器、注释、...
- 编程小白学做题:Python 的经典编程题及详解,附代码和注释(八)
-
适合Python3+的6道编程练习题(附详解)1找出字典中值最小的键题目描述:找出字典中值最小的键(如{"a":5,"b":2,"c...
- 新手学Python避坑,学习效率狂飙! 二十一、print()函数
-
感谢大家对《新手学Python避坑,学习效率狂飙!》系列的点赞、关注和收藏,今天这编是这个系列的第二十一个分享,前面还有二十个,大家可以关注下之前发布的文章。下面是我们今天第三个的分享:在Pytho...
- 编程小白学做题:Python 的经典编程题及详解,附代码和注释(六)
-
适合Python3+的6道编程练习题(附详解)1、打印杨辉三角的前n行题目描述:给定正整数n,打印杨辉三角的前n行(每个数等于它上方两数之和,每行首尾为1)。编写思路:杨辉三角的第i...
- 让你的Python代码更易读:7个提升函数可读性的实用技巧
-
如果你正在阅读这篇文章,很可能你已经用Python编程有一段时间了。今天,让我们聊聊可以提升你编程水平的一件事:编写易读的函数。请想一想:我们花在阅读代码上的时间大约是写代码的10倍。所以,每当你创建...
- python入门到脱坑 函数—return语句
-
Python函数中的return语句详解一、return语句基础1.1基本功能return语句用于从函数中返回一个值,并立即结束函数的执行。defadd(a,b):returna+...
- 编程小白学做题:Python 的经典编程题及详解,附代码和注释(七)
-
适合Python3+的6道编程练习题(附详解)1.检查字符串是否以指定子串开头题目描述:判断字符串是否以给定子串开头(如"helloworld"以"hello&...
- python的注释符是什么(python的合法注释符号是什么)
-
python的注释符是什么?python的注释符包括单行注释符和多行注释符。一、python单行注释符号(#)井号(#)常被用作单行注释符号,在代码中使用#时,它右边的任何数据都会被忽略,当做是注释。...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)