当前位置: 首页 > article >正文

8.5K+ Star!Skyvern:一个基于LLMs和计算机视觉自动化浏览器工作流的工具

Skyvern 简介

Skyvern[1] 一个使用大型语言模型(LLMs)和计算机视觉自动化浏览器工作流程的工具。 它通过API端点提供服务,能够在无需定制代码的情况下自动化多个网站上的手动工作流程。

Skyvern利用计算机视觉和LLMs实时解析视口(viewport)中的项目,规划交互并执行操作。

它具有适应网站布局变化、在未知网站上操作的能力,并能利用LLMs处理复杂交互情况。

项目特点

主要特点
  1. 无需定制代码:Skyvern 能够映射视觉元素到完成工作流所需的动作,无需任何定制代码。

  2. 抵抗网站布局变化:由于没有预定义的XPath或其他选择器,Skyvern 不会受到网站布局变化的影响。

  3. 跨网站工作流应用:Skyvern 能够将单一工作流应用于大量网站,因为它能够理解完成工作流所需的交互。

  4. 复杂情况处理:Skyvern 利用 LLMs 推理交互,以确保能够覆盖复杂情况。

使用场景

Skyvern 可以应用于多种场景,包括但不限于:

  • 保险报价获取:从 Geico 等保险公司获取汽车保险报价。

  • 竞争对手分析:理解不同网站上的产品是否相同,即使尺寸略有不同。

  • 发票下载:自动化从多个不同网站上下载发票的过程。

  • 工作申请:自动化工作申请流程。

  • 材料采购:为制造公司自动化材料采购流程。

项目使用

API端点

Skyvern 提供了一个简单的 API 端点来完全自动化网站上的手动工作流。用户可以通过创建任务(Tasks)和工作流(Workflows)来指导 Skyvern 完成特定的目标。

任务是 Skyvern 中的基本构建块,每个任务都是对 Skyvern 的单个请求,指示它导航到网站并完成特定目标。工作流则是将多个任务链接在一起形成工作单元的方式。

快速开始
Docker Compose 设置(推荐)
  1. 确保你的机器上安装并运行了 Docker Desktop[2]。

  2. 确保本地没有运行 postgres(运行 docker ps 检查)。

  3. 克隆仓库并导航到根目录。

  4. 在 docker-compose.yml[3] 中填写 LLM 提供者密钥。如果你想在远程服务器上运行 Skyvern,请确保在 docker-compose.yml中为 UI 容器设置了正确的服务器 IP。

  5. 通过命令行运行以下命令:

docker compose up -d
  1. 在浏览器中导航到 http://localhost:8080 开始使用 UI。

完整设置
  1. 确保你安装了以下软件:

  • Brew[4](如果你使用的是 Mac)

  • Poetry[5]

  • node[6]

  • Docker[7]

  1. 克隆仓库并导航到根目录。

  2. 打开 Docker Desktop(适用于 Windows、macOS 和 Linux)或运行 Docker Daemon。

  3. 运行设置脚本安装必要的依赖项并设置你的环境:

./setup.sh
  1. 启动服务器:

./run_skyvern.sh
  1. 你可以通过 UI 开始发送请求到服务器。要启动 UI,请运行以下命令:

./run_ui.sh
  1. 在浏览器中导航到 http://localhost:8080 开始使用 UI。

项目资源

  • 文档网站[8]

  • 电子邮件[9]

  • Discord[10]


注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。

欢迎关注&点赞&在看,感谢你的阅读~


资源列表

[1]

Github地址: https://github.com/Skyvern-AI/skyvern

[2]

Docker Desktop: https://www.docker.com/products/docker-desktop/

[3]

docker-compose.yml: https://github.com/Skyvern-AI/skyvern/blob/main/docker-compose.yml

[4]

Brew安装: https://brew.sh/

[5]

Poetry安装: https://python-poetry.org/docs/#installation

[6]

Node安装: https://nodejs.org/en/download/

[7]

Docker安装: https://docs.docker.com/engine/install/

[8]

文档网站: https://docs.skyvern.ai

[9]

电子邮件: mailto:founders@skyvern.com

[10]

Discord: https://discord.gg/fG2XXEuQX3


http://www.kler.cn/a/377966.html

相关文章:

  • StandardThreadExecutor源码解读与使用(tomcat的线程池实现类)
  • openstack之guardian介绍与实例创建过程
  • 高级Python自动化运维:容器安全与网络策略的深度解析
  • Qt中的动态链接库编程(Q_DECL_IMPORT、Q_DECL_EXPORT)
  • 【折腾一上午】Java POI 导出 Excel 自适应列宽行高
  • HbuildderX运行到手机或模拟器的Android App基座识别不到设备 mac
  • Day 41 || 1049. 最后一块石头的重量 II 、494. 目标和、474.一和零
  • 机器学习之fetch_olivetti_faces人脸识别--基于Python实现
  • 数据智能驱动金融策略优化:民锋智能分析技术的应用
  • 深度学习-38-基于PyTorch的卷积神经网络AlexNet
  • 【Java笔记】1-JDK/JRE/JVM是个啥?
  • Golang | Leetcode Golang题解之第518题零钱兑换II
  • pgsql数据量大之后可能遇到的问题
  • SpringCloudAlibaba实战入门之OpenFeign高级用法(十)
  • 数据结构-二叉树中的递归
  • [每周一更]-(第121期):模拟面试|微服务架构面试思路解析
  • 虚函数和纯虚函数是 C++ 中实现多态性的关键概念
  • 【算法笔记】位运算算法原理深度剖析
  • 单向函数、单向陷门函数、困难问题
  • PHP的 CSRF、XSS 攻击和防范
  • promise的catch放在then前面的场景
  • OpenGL入门003——使用Factory设计模式简化渲染流程
  • 从零开始的c++之旅——继承
  • SMTP协议,即简单邮件传输协议
  • 20241031 Apache2修改日志里面的时间格式
  • SQL Server 2008 R2 详细安装教程及错误解决教程