当前位置: 首页 > article >正文

Nanobrowser:开源AI自动化神器 OpenAI Operator替代品

Nanobrowser介绍

Nanobrowser 是一款基于 AI 驱动的 Web 自动化开源工具,以 Chrome 扩展程序的形式运行,让用户只需利用自己的 LLM API 密钥便能轻松启动多代理工作流,成为 OpenAI Operator 的免费替代方案。它不仅支持灵活接入您喜欢的 LLM 提供商,还确保所有操作在本地浏览器中执行,从而保障用户隐私与数据安全。通过透明的开源机制和直观的交互侧边栏,Nanobrowser 能够自动执行跨网站的重复任务,并实时反馈任务状态和对话历史,助您高效管理复杂的网络自动化流程。目前已支持 OpenAI 和 Anthropic,未来将不断扩展更多 LLM 集成,满足不断升级的自动化需求,真正实现高性价比与便捷操作的完美结合。

Nanobrowser主要特点

  • 多代理系统:专门的人工智能代理协作完成复杂的网络工作流程
  • 交互式侧面板:直观的聊天界面,可实时更新状态
  • 任务自动化:无缝自动执行跨网站重复的 Web 自动化任务
  • 后续问题:询问有关已完成任务的后续问题
  • 对话历史记录:轻松访问和管理您的 AI 代理交互历史记录
  • 多个 LLM 支持:连接您首选的 LLM 提供商,并将不同的模型分配给不同的代理

 

Nanobrowser 是一款开源的 Chrome 扩展工具,专注于 AI 驱动的网页自动化。它基于多智能体系统实现复杂的网页任务,如信息提取、自动化操作等。用户可以使用自己的 LLM API 密钥,灵活选择不同的模型为不同智能体提供支持。

Nanobrowser 完全免费,作为 OpenAI Operator 的开源替代方案,支持在本地浏览器运行,注重隐私保护,不涉及云服务。它让 AI 在浏览器中变得更加智能高效,适用于信息收集、电商购物、内容创作等多种场景。

Nanobrowser 的主要功能

  • 多智能体系统
    • Planner(规划器):负责制定和调整任务策略。
    • Navigator(导航器):执行网页导航和操作。
    • Validator(验证器):检查任务是否成功完成。

  • 交互式侧边栏:提供直观的聊天界面,实时显示任务状态,用户用自然语言与智能体交互。
  • 任务自动化:自动化重复性网页任务,如信息提取、数据整理等,节省时间和精力。
  • 多 LLM 支持:支持连接多种大型语言模型(LLM)提供商,用户根据需求为不同智能体选择不同的模型。

Nanobrowser 的技术原理

  • 基于 LLM 的智能体架构:Nanobrowser 的核心是多智能体系统,每个智能体由大型语言模型(LLM)驱动。智能体分工协作,高效完成复杂任务:
    • 规划器 Planner :制定和完善任务策略。
    • 导航器 Navigator :浏览网站并执行操作。
    • 验证器 Validator :确认任务结果,检查任务是否成功完成。

  • 动态任务调整与自适应性:当遇到障碍或任务失败时,Planner 智能体自动调整策略,重新规划任务路径,确保任务能够成功完成。
  • 集成多种 LLM 提供商:支持连接 OpenAI、Anthropic 等主流 LLM 提供商,用户根据需求选择不同的模型,为不同智能体分配最适合的模型。

如何运行 Nanobrowser

快速开始!

1. 下载

  • 下载最新的 nanobrowser.zip 文件。下载链接

2. 安装

  • 解压 nanobrowser.zip
  • 在 Chrome 中打开 chrome://extensions/。 在页面右上角启用 开发者模式
  • 开启后,点击页面左上角的 加载已解压的扩展程序按钮。
  • 选择解压后的 nanobrowser 文件夹。

3. 配置智能体模型

  • 点击工具栏中的 Nanobrowser 图标,打开侧边栏。
  • 点击 设置 图标(右上角)。
  • 添加你的 LLM API 密钥。
  • 为不同智能体(Navigator、Planner、Validator)选择使用的模型。

从源代码构建项目

1. 前置条件

  • 安装 Node.js(版本 22.12.0 或更高)。
  • 安装 pnpm(版本 9.15.1 或更高)。
  • Node.js 下载链接:https://nodejs.org/
  • pnpm 安装指南:https://pnpm.io/installation

2. 克隆代码库

git clone https://github.com/nanobrowser/nanobrowser.git
cd nanobrowser

3. 安装依赖

4. 构建扩展

5. 加载扩展

  • 构建完成的扩展将位于 dist 目录。
  • 按照快速入门部分的步骤将扩展加载到浏览器中。

6. 开发模式(可选)

Nanobrowser 的未来规划

Nanobrowser 的开发团队正在积极开发新功能,以下是一些即将推出的功能: - 扩展 LLM 支持:集成更多大语言模型提供商。 - 安全防火墙:实施保护措施以确保安全的浏览操作。 - 内存优化:减少令牌使用,同时保持上下文感知。 - 会话回放:高效回放历史任务,同时减少令牌消耗。 - 专用代理:开发针对复杂领域任务的专用代理。


http://www.kler.cn/a/582644.html

相关文章:

  • 桂链:什么是区块链智能合约和链码?
  • 浅谈SSE爬虫
  • Flutter 学习之旅 之 flutter 不使用插件,实现简单自定义弹窗PopupDialog功能
  • 单片机FreeRTOS系统中,CPU计算的延时函数
  • es6 尚硅谷 学习
  • Qt表格美化笔记
  • React 组件测试【React Testing Library】
  • [Unity] 封装一个依赖于MonoBehaviour的计时器(上)
  • 2025年Draw.io最新版本下载安装教程,附详细图文
  • 从0到1入门Docker
  • Node-RED基础1
  • A-LOAM工程笔记(三):雷达里程计(lidar odometry)高频粗估计
  • 挤压车间降温设备
  • CTFshow 【WEB入门】信息搜集 【VIP限免】 web1-web17
  • 目标思维——数据分析源自问题,高于问题
  • ListView_GetIconBufferX函数和ListView_GetIconBufferY函数和RECT结构的关系
  • C语言实现队列数据结构:思路与代码详解
  • ARM Cortex-M 内存映射详解:如何基于寄存器直接读写 寄存器映射方式编码程序 直接操作硬件寄存器来控制 MCU
  • JAVA(6)-运算符
  • [密码抓取] Windows 密码抓取 — 浏览器、数据库等其它密码的抓取