当前位置: 首页 > article >正文

AppAgent 源码 (AndroidController 类 )

1. AndroidController 类

AndroidController 类,用于通过 ADB(Android Debug Bridge)命令控制连接的 Android 设备。它提供了一系列方法来实现常见的 Android 设备操作,例如获取屏幕截图、获取 XML 布局文件、模拟点击、输入文本、滑动和长按操作。

以下是详细解释:

  1. 初始化 (__init__)

    • 输入参数
      • device: 表示设备的标识符(通过 adb devices 命令可以获取)。
    • 初始化内容
      • self.device: 保存设备 ID。
      • self.screenshot_dir: 保存截图的默认路径(从全局 configs 中获取)。
      • self.xml_dir: 保存 XML 文件的默认路径(从全局 configs 中获取)。
      • self.width, self.height: 通过调用 get_device_size() 获取设备屏幕宽高。
      • self.backslash: 为了处理路径中的反斜杠。
  2. 获取设备屏幕尺寸 (get_device_size)

    • 功能
      • 执行 adb shell wm size 命令以获取设备屏幕的分辨率。
      • 如果获取成功,解析返回值(例如 "Physical size: 1080x1920")并提取宽高。
      • 如果失败,返回 (0, 0)
  3. 获取屏幕截图 (get_screenshot)

    • 功能
      • 将设备屏幕截图保存到设备的指定目录,并将其拉取到本地。
    • 步骤
      • 构造两个 ADB 命令:
        • screencap -p: 在设备上保存截图。
        • pull: 将截图从设备目录拉取到本地目录。
      • 执行命令并检查结果。
      • 如果成功,返回本地保存的文件路径;如果失败,返回错误信息。
  4. 获取 XML 布局文件 (get_xml)

    • 功能
      • 获取设备当前的 UI 布局并保存为 XML 文件,然后拉取到本地。
    • 步骤
      • 构造两个 ADB 命令:
        • uiautomator dump: 生成 XML 文件。
        • pull: 将 XML 文件从设备拉取到本地。
      • 执行命令并检查结果。
      • 如果成功,返回本地保存的文件路径;如果失败,返回错误信息。
  5. 返回操作 (back)

    • 功能
      • 模拟按下返回键。
    • 实现
      • 执行 adb shell input keyevent KEYCODE_BACK 命令。
  6. 点击操作 (tap)

    • 功能
      • 在屏幕的指定位置模拟点击。
    • 实现
      • 执行 adb shell input tap x y,其中 x, y 是点击位置的坐标。
  7. 文本输入 (text)

    • 功能
      • 模拟文本输入操作。
    • 处理特殊字符
      • 替换空格为 %s
      • 删除单引号('),防止命令解析错误。
    • 实现
      • 执行 adb shell input text input_str
  8. 长按操作 (long_press)

    • 功能
      • 模拟长按屏幕某个位置。
    • 实现
      • 执行 adb shell input swipe x y x y duration,通过滑动命令模拟长按,duration 表示持续时间。
  9. 滑动操作 (swipe)

    • 功能
      • 模拟从某个起点朝某个方向滑动。
    • 步骤
      • 根据屏幕宽度计算滑动距离(短、中、长)。
      • 根据方向设置偏移量:
        • 上:(0, -2 * unit_dist)
        • 下:(0, 2 * unit_dist)
        • 左:(-unit_dist, 0)
        • 右:(unit_dist, 0)
      • 构造并执行 adb shell input swipe 命令。
  10. 精确滑动 (swipe_precise)

    • 功能
      • 模拟从指定起点滑动到指定终点。
    • 实现
      • 接收起点和终点的坐标 (start_x, start_y)(end_x, end_y)
      • 构造并执行 adb shell input swipe 命令,指定滑动路径和持续时间。

2. AndroidController 类源码

class AndroidController:
    def __init__(self, device):
        self.device = device
        self.screenshot_dir = configs["ANDROID_SCREENSHOT_DIR"]
        self.xml_dir = configs["ANDROID_XML_DIR"]
        self.width, self.height = self.get_device_size()
        self.backslash = "\\"

    def get_device_size(self):
        adb_command = f"adb -s {self.device} shell wm size"
        result = execute_adb(adb_command)
        if result != "ERROR":
            return map(int, result.split(": ")[1].split("x"))
        return 0, 0

    def get_screenshot(self, prefix, save_dir):
        cap_command = (
            f"adb -s {self.device} shell screencap -p "
            f"{os.path.join(self.screenshot_dir, prefix + '.jpg').replace(self.backslash, '/')}"
        )
        pull_command = (
            f"adb -s {self.device} pull "
            f"{os.path.join(self.screenshot_dir, prefix + '.jpg').replace(self.backslash, '/')} "
            f"{os.path.join(save_dir, prefix + '.jpg')}"
        )
        result = execute_adb(cap_command)
        if result != "ERROR":
            result = execute_adb(pull_command)
            if result != "ERROR":
                return os.path.join(save_dir, prefix + ".jpg")
            return result
        return result

    def get_xml(self, prefix, save_dir):
        dump_command = (
            f"adb -s {self.device} shell uiautomator dump "
            f"{os.path.join(self.xml_dir, prefix + '.xml').replace(self.backslash, '/')}"
        )
        pull_command = (
            f"adb -s {self.device} pull "
            f"{os.path.join(self.xml_dir, prefix + '.xml').replace(self.backslash, '/')} "
            f"{os.path.join(save_dir, prefix + '.xml')}"
        )
        result = execute_adb(dump_command)
        if result != "ERROR":
            result = execute_adb(pull_command)
            if result != "ERROR":
                return os.path.join(save_dir, prefix + ".xml")
            return result
        return result

    def back(self):
        adb_command = f"adb -s {self.device} shell input keyevent KEYCODE_BACK"
        ret = execute_adb(adb_command)
        return ret

    def tap(self, x, y):
        adb_command = f"adb -s {self.device} shell input tap {x} {y}"
        ret = execute_adb(adb_command)
        return ret

    def text(self, input_str):
        input_str = input_str.replace(" ", "%s")
        input_str = input_str.replace("'", "")
        adb_command = f"adb -s {self.device} shell input text {input_str}"
        ret = execute_adb(adb_command)
        return ret

    def long_press(self, x, y, duration=1000):
        adb_command = (
            f"adb -s {self.device} shell input swipe {x} {y} {x} {y} {duration}"
        )
        ret = execute_adb(adb_command)
        return ret

    def swipe(self, x, y, direction, dist="medium", quick=False):
        unit_dist = int(self.width / 10)
        if dist == "long":
            unit_dist *= 3
        elif dist == "medium":
            unit_dist *= 2

        if direction == "up":
            offset = 0, -2 * unit_dist
        elif direction == "down":
            offset = 0, 2 * unit_dist
        elif direction == "left":
            offset = -1 * unit_dist, 0
        elif direction == "right":
            offset = unit_dist, 0
        else:
            return "ERROR"

        duration = 100 if quick else 400
        adb_command = f"adb -s {self.device} shell input swipe {x} {y} {x+offset[0]} {y+offset[1]} {duration}"
        ret = execute_adb(adb_command)
        return ret

    def swipe_precise(self, start, end, duration=400):
        start_x, start_y = start
        end_x, end_y = end
        adb_command = f"adb -s {self.device} shell input swipe {start_x} {start_x} {end_x} {end_y} {duration}"
        ret = execute_adb(adb_command)
        return ret

3. 例子演示

from and_controller import AndroidController
import os

device_id = "your connected device id"

# 初始化 AndroidController
controller = AndroidController(device=device_id)

# 打印设备屏幕分辨率
width, height = controller.get_device_size()
print(f"Device screen resolution: {width}x{height}")

<class 'os._Environ'>
<class 'dict'>
Warning! No module named 'sounddevice'
Warning! No module named 'matplotlib'
Warning! No module named 'keras'
Device screen resolution: 1220x2712
import time
import datetime
app = "gaode"
root_dir = "./"
work_dir = os.path.join(root_dir, "apps")
if not os.path.exists(work_dir):
    os.mkdir(work_dir)
work_dir = os.path.join(work_dir, app)
if not os.path.exists(work_dir):
    os.mkdir(work_dir)
demo_dir = os.path.join(work_dir, "demos")
if not os.path.exists(demo_dir):
    os.mkdir(demo_dir)
demo_timestamp = int(time.time())
task_name = datetime.datetime.fromtimestamp(demo_timestamp).strftime("self_explore_%Y-%m-%d_%H-%M-%S")
task_dir = os.path.join(demo_dir, task_name)
os.mkdir(task_dir)


# 截取屏幕截图并保存
screenshot_path = controller.get_screenshot("test_screenshot", task_dir)
if screenshot_path != "ERROR":
    print(f"Screenshot saved at: {screenshot_path}")
else:
    print("Failed to capture screenshot.")

Screenshot saved at: ./apps\gaode\demos\self_explore_2024-12-26_01-21-10\test_screenshot.jpg
# 获取并保存 XML 文件
xml_path = controller.get_xml("test_layout", task_dir)
if xml_path != "ERROR":
    print(f"XML layout saved at: {xml_path}")
else:
    print("Failed to capture XML layout.")
    
XML layout saved at: ./apps\gaode\demos\self_explore_2024-12-26_01-21-10\test_layout.xml

项目结构:
在这里插入图片描述

# 模拟返回按键
result = controller.back()
print(f"Back key result: {result}")    

Back key result: 

如果成功,result结果为空

# 模拟点击屏幕坐标 (100, 200)
result = controller.tap(100, 200)
# 模拟输入文本
result = controller.text("Hello World")
# 模拟长按屏幕坐标 (150, 300) 持续 2 秒
result = controller.long_press(150, 300, duration=2000)
# 模拟从 (100, 500) 向上滑动
result = controller.swipe(100, 500, "up")
# 模拟从 (100, 200) 滑动到 (300, 400)
result = controller.swipe_precise((100, 200), (300, 400), duration=1000)

http://www.kler.cn/a/456862.html

相关文章:

  • 解决virtualbox出现开启DHCP之后ubuntu虚拟机之后IP重复的问题
  • PyAudio库基本知识详解——为自制PCM音频播放器做准备
  • 网络安全 | 云安全与物联网(IoT)
  • c++类和对象(六个默认成员函数)
  • 云手机+Facebook:让科技与娱乐完美结合
  • leetcode 3312. 查询排序后的最大公约数
  • 【LLM论文日更】| 训练大型语言模型在连续潜在空间中进行推理
  • 服务器被攻击怎么办
  • 如何注册华为云国际版账户:详细步骤指南
  • info There appears to be trouble with your network connection. Retrying
  • YOLOX算法及其改进
  • C语言实现跨主机通讯
  • 6-Gin 路由详解 --[Gin 框架入门精讲与实战案例]
  • 电商项目-数据同步解决方案(三)商品上架同步更新ES索引库
  • vue3使用element-plus,解决 el-table 多选框,选中后翻页再回来选中失效问题
  • 如何部署SparkHistoryServer
  • 【Unity/C#】Fisher-Yates洗牌算法
  • 湖仓一体架构解析:数仓架构选择(第48天)
  • 软件安全性测试有多重要?好用的安全测试工具有哪些?
  • 使用 CSS 的 `::selection` 伪元素来改变 HTML 文本选中时的背景颜色
  • docker安装记录
  • leetcode hot100 括号生成
  • 实战ubuntu22.04 软raid查看命令
  • 【AI学习】DeepSeek-V3 技术报告学习:总体架构
  • pugixml XML配置文件 的增删改查
  • Qt中QWidget自定义形状