当前位置: 首页 > article >正文

自动登录 RPA 的进阶:滑块验证的巧妙实现

​在RPA的众多应用场景的探索中,自动登录是一个至关重要的环节,它为后续的自动化操作奠定了基础。然而,当我们面对滑块验证这一常见的挑战时,常常会感到困惑和无从下手。本文就来分享自动登录RPA的进阶----滑块验证如何实现。

在分享自动登录RPA的进阶之前,我们先来了解一个工具包–ddddocr

一、ddddocr:验证码识别的利器

ddddocr是一个功能强大的验证码识别工具包,专门用于处理各种复杂的验证码,包括滑块验证码、文字点选、算术、字母、数字等类型。它基于深度学习技术,能够准确地识别图像中的滑块位置,并提供相应的操作指令。

二、使用ddddocr实现滑块验证

在先前的探索中,如《揭秘AI+RPA:CSDN热榜数据抓取RPA与AI融合之道-CSDN博客》和《揭秘AI+RPA:CSDN 自动登录 RPA 的实现之道-CSDN博客》的所述,我们可以成功获取到谷歌浏览器的客户端。

    option = ChromiumOptions().set_paths(
        local_port=port
    ).set_argument('--start-maximized')
    client = ChromiumPage(addr_or_opts=option, timeout=10)

本文以知乎账号密码登录时的滑块验证为例,展示如何利用 ddddocr 来攻克这一难题。

1. 寻找拖拽的iframe标签

首先,我们需要在页面中找到拖拽滑块的 iframe 标签,这是后续操作的基础。

	iframe = client.get_frame(1)
	sleep(1)

2. 获取完整图片

接下来,获取包含滑块背景的完整图片。通过定位完整图片的元素,并获取其图片的 URL,然后使用 requests 库获取图片数据。

	image_ele = iframe.ele('@id:yidun_bg-img')
    image_url = image_ele.attr('src')
    response = requests.get(image_url)
    if response.status_code == 200:
        image_data = response.content
    else:
    	raise Exception('Failed to retrieve the image')

3. 获取缺口图片

和2一样的方法,获取带有缺口的图片数据。

	gap_image_ele = iframe.ele('@id:yidun_jigsaw')
    gap_image_url = image_ele.attr('src')
    response = requests.get(image_url)
    if response.status_code == 200:
        gap_image_data = response.content
    else:
    	raise Exception('Failed to retrieve the gap image')

4. 利用ddddocr工具包计算缺口的位置

这里是很关键的一步,使用 ddddocr 工具包的强大功能来计算缺口的准确位置。

	slider_ocr = ddddocr.DdddOcr(det=True,show_ad=False)
	slider_ocr.slide_match(gap_image_data, image_data)
	target = result.get('target')

让我们来分析一下slide_match方法,在我们的例子中,走的是else分支,所以simple_target对象先忽略。
该方法中有两个核心方法cv2.matchTemplate和cv2.minMaxLoc,cv2.matchTemplate使用了相关系数归一化方法进行目标图像和背景图像的匹配,而cv2.minMaxLoc方法用于在cv2.matchTemplate方法匹配的结果中获取最小、最大匹配值以及位置。

    def slide_match(self, target_bytes: bytes = None, background_bytes: bytes = None, simple_target: bool = False,
                    flag: bool = False):
        if not simple_target:
            ……
        # 会走else
        else:
            target = cv2.imdecode(np.frombuffer(target_bytes, np.uint8), cv2.IMREAD_ANYCOLOR)
            target_y = 0
            target_x = 0

        background = cv2.imdecode(np.frombuffer(background_bytes, np.uint8), cv2.IMREAD_ANYCOLOR)

        background = cv2.Canny(background, 100, 200)
        target = cv2.Canny(target, 100, 200)

        background = cv2.cvtColor(background, cv2.COLOR_GRAY2RGB)
        target = cv2.cvtColor(target, cv2.COLOR_GRAY2RGB)

        # 核心方法1,使用相关系数归一化方法进行目标图像和背景图像的匹配。
        # res是一个二维数组,大小与背景图像大小一致,每个位置表示目标图像在该位置与背景图像的匹配程度,范围是(-1, 1)
        res = cv2.matchTemplate(background, target, cv2.TM_CCOEFF_NORMED)

		# 核心方法2,通过minMaxLoc获取最小、最大匹配值以及位置
        min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
        h, w = target.shape[:2]
		# 图像坐标系,通常以左上角为原点,向右为 x 轴正方向,向下为 y 轴正方向。
        bottom_right = (max_loc[0] + w, max_loc[1] + h)
        return {"target_y": target_y,
                "target": [int(max_loc[0]), int(max_loc[1]), int(bottom_right[0]), int(bottom_right[1])]}

5. 计算滑块滑动的轨迹

由slide_match方法可知,target是一个对象。target的key对应的value是一个list,分别对应最大匹配位置的坐标,以及从该坐标开始的h * w的区域的右下角的坐标。即背景图像缺失的图像的x轴的坐标点为target[0]。

有了target[0],我们就可以利用高中物理学到的匀加速运动的位移公式和速度公式,计算出滑动从起点到target[0]滑动的轨迹点。

让我们先来回顾下高中物理中的这些公式

  • 速度公式
    v = v 0 + a t v = v_0 + at v=v0+at
    其中是v末速度,是v0是初速度,a是加速度,t是时间。

  • 位移公式
    s = v 0 t + 1 2 a t 2 s = v_0t + \frac{1}{2}at^2 s=v0t+21at2
    其中s是位移。

以下是公式的代码实现。

    v, t, acc_dis = 0, 0.5, 0
    plus = []
    while acc_dis < distance:
        if acc_dis < mid:
            a = round(random.uniform(1.0, 2.0), 1)
        else:
            a = -round(random.uniform(1.0, 2.0), 1)
        s = v * t + 0.5 * a * (t ** 2)
        v = v + a * t
        acc_dis += s
        plus.append(round(s))

6. 让RPA模拟人的动作,移动滑块到指定位置

最后一步,让 RPA 模拟人类的动作,将滑块移动到指定位置。

	move_btn = iframe.ele('@class:yidun_control')
    iframe.actions.hold(move_btn)
    for track in plus:
        iframe.actions.move(
            offset_x=track,
            # y轴的偏移,可以指定随机值
            offset_y=round(random.uniform(1, 10), 0),
            duration=0.1
        )
    time.sleep(0.1)
    iframe.actions.release(move_btn)

三、总结

在 RPA 的探索中,自动登录是一个关键环节,而滑块验证则是一个常见的挑战。本文通过使用 ddddocr 工具包,有效地解决了滑块验证问题,实现自动登录 RPA 的进阶。当然,在实际应用场景中,我们还需要根据具体的情况进行调整和优化,以确保 RPA 程序的稳定性和可靠性。


http://www.kler.cn/news/313914.html

相关文章:

  • 远程连接MySQL并操作
  • PostgreSQL JAVA与SQL集成之PL/Java
  • 科研绘图系列:R语言散点图和小提琴图(scatter plot violin plot)
  • 【ORACLE】客户端或plsql无法连接Oracle问题之一
  • 基于A2C与超启发式的航天器星载自主任务规划算法-笔记
  • 大数据新视界 --大数据大厂之JavaScript在大数据前端展示中的精彩应用
  • Vue 修饰符 | 指令 区别
  • C/C++笔记
  • python基础题练习
  • leetcode 605.种花问题
  • 青岛特某电新能源有限公司-充电业务流程及数据交互规范-集控前置-精简版V1.0
  • Debian 12上安装google chrome
  • 前端vue-自己封装组件并使用三步走
  • k8s pod网络故障注入,命令行实现
  • 功能强大的任务 / 项目管理工具GoodTask for Mac
  • Redis 集群搭建教程
  • leetcode刷题(71-75)
  • ATMEGA328P芯片引脚介绍
  • 如何配置ssh key 到gitlab, 实现git push
  • 京东商品属性的详细api数据解析:颜色、尺寸与材质
  • 《深度学习》PyTorch框架 优化器、激活函数讲解
  • OpenHarmony(鸿蒙南向开发)——标准系统方案之瑞芯微RK3568移植案例(下)
  • 鸿蒙搭配前端开发:应用端与WEB端交互
  • 安卓数据存储——SQLite
  • VM16安装macOS11
  • 《线性代数》笔记
  • 精选写作技巧!分享4款ai写毕业论文可以写出公式表格的软件
  • windows安装docker、elasticsearch、kibana、cerebro、logstash
  • 西圣、吉玛仕、绿联电容笔好不好用?热门平替电容笔超真实测评!
  • 淘宝npm镜像源更新后,如何正常使用npm命令