当前位置: 首页 > article >正文

深入理解Agentic Workflows

本文来源:https://weaviate.io/blog/what-are-agentic-workflows

这篇文章将带你深入理解AI Agent、Agentic AI、Agentic Workflows、Agentic Architectures等概念,非常值得推荐。

一、什么是 AI Agents?

AI Agents 是结合了大模型进行推理和决策以及包含现实世界交互工具的系统,能够在少量人工参与下完成复杂任务。AI Agents 被赋予特定角色,并拥有不同程度的自主权以实现其最终目标。它们还配备了记忆功能,使它们能够从过去的经验中学习,并随着时间的推移提高性能。

为了更好地理解 Agents 如何融入 Agentic Workflows,我们将探讨 AI Agents 的核心组件。

1、AI Agents 的组件

尽管 AI Agents 被设计用于半自主决策,但它们依赖于一个更大的组件框架来正常运行。这个框架包括使 AI Agents 能够有效推理的大模型、帮助 AI Agents 完成任务的工具,以及让 AI Agents 从过去的经验中学习并随着时间的推移改进响应的记忆。

2、推理 Reasoning

AI Agents 之所以如此有效,部分原因在于它们具备迭代推理的能力,这本质上使 AI Agents 能够在整个问题解决过程中主动 “思考”。AI Agents 的推理能力源自其底层的大模型,并具有两个主要功能:规划(Planning)和反思(Reflecting)。

在规划阶段,AI Agents 执行任务分解,即将更复杂的问题拆分为更小、可操作的步骤。这种技术使 AI Agents 能够系统性地处理任务,并允许它们为不同任务使用不同的工具。它还允许进行查询分解,即将复杂查询拆分为更简单的查询,从而提高大模型响应的准确性和可靠性。

AI Agents 还通过反思其行动的结果来进行推理。这使它们能够根据从外部来源获取的结果和数据,评估并迭代调整其行动计划。

3、工具 Tools

大模型拥有静态的参数化知识,这意味着它们的理解仅限于训练期间先验的信息。为了扩展其能力,使其超越原始数据范畴,AI Agents 可以利用外部工具,如网络搜索引擎、API、数据库和其他计算框架。这意味着 AI Agents 可以实时访问外部数据,以指导其决策并完成需要与其他应用交互的任务。

工具通常与权限配对,例如查询 API、发送消息或访问特定文档或数据库模式的能力。下表列出了几种常见的 AI Agents 工具及其执行的任务。

当大模型选择一个工具来帮助完成任务时,它会进行一种称为函数调用(Function Call)的行为,这扩展了其能力,使其不再局限于简单的文本生成,而是能够与现实世界进行交互。

使用哪个工具的选择可以由最终用户预先确定,也可以交给 AI Agents 来决定。让 AI Agents 动态选择工具可能有助于解决更复杂的任务,但对于较简单的工作流程,使用预定义的工具可能更为高效,而动态选择工具则可能增加不必要的复杂性。

4、记忆 Memory

从过去的经验中学习并记住行动发生的背景,是使 Agentic Workflow 与纯粹由大模型驱动的工作流不同的部分原因。记忆是一个关键组件,能够跨多个用户交互和会话,获取和存储上下文和反馈。AI Agents 有两种主要类型的记忆:短期记忆(short-term memory)和长期记忆(long-term memory)。

短期记忆存储更即时的信息,如历史对话,这有助于 AI Agents 确定下一步该采取什么行动来完成其总体目标。长期记忆存储随着时间的推移在多个会话中积累的信息和知识,使得 AI Agents 能够个性化,并随着时间的推移提高性能。

二、什么是 Agentic Workflows?

一般来说,Workflow 是一系列相互连接的步骤,旨在完成特定的任务或目标。最简单的工作流是确定性的,意味着它们遵循预定义的步骤序列,无法适应新的信息或变化的条件。例如,一个自动化的费用审批工作流可能是这样的:“如果费用被标记为‘餐饮’且金额低于 30 美元,则自动批准。”

然而,有些工作流会利用大模型或其他 AI 技术。这些通常被称为 AI Workflows,可以是 Agentic 或非 Agentic 的。在非 Agentic 工作流中,大模型会根据指令生成输出。例如,文本摘要工作流会将一段较长的文本作为输入,给一定的提示词让大模型进行摘要,并简单地返回摘要结果。但是,仅仅因为一个工作流程使用了大模型,并不一定意味着它是 Agentic 的。

Agentic Workflow 是由单个 AI Agent 或几个 AI Agents 动态执行的一系列连接步骤,以实现特定任务或目标。AI Agents 被用户授予权限,使其在有限的自主权下收集数据、执行任务并做出决策,这些决策将在现实世界中执行。Agentic Workflow 还利用了 Agents 的核心组件,包括其推理能力、通过工具与环境交互的能力以及持久的记忆,从而将传统工作流彻底转变为响应式、自适应和自我进化的过程。

1、是什么让 Workflow 变得 Agentic?

当一项 AI Workflows 由一个或多个 AI Agents 引导和影响任务进展时,它便成为 Agentic Workflow。在现有的非 Agentic 工作流中加入 Agents ,可以创建一种混合方法,将结构化工作流的可靠性和可预测性,与大模型的智能性和适应性相结合。

Agentic Workflows 的特点在于它们能够:

  1. 制定计划。Agentic Workflow 从规划开始。大模型通过任务分解将复杂任务拆分为较小的子任务,然后确定最佳的执行路径。
  2. 使用工具执行操作。 Agentic Workflows 使用一组预定义的工具,并结合权限来完成任务并执行生成的计划。
  3. 反思与迭代。Agents 可以在每个步骤评估结果,根据需要调整计划,并循环往复,直到结果令人满意。

如你所见,我们需要区分三种类型的工作流程:传统的非 AI Workflows、非 Agentic AI Workflows 和 Agentic Workflows。

传统的基于规则的 Workflows 与 AI Workflows 的区别在于,前者使用预定义的步骤,而后者使用 AI 模型来完成任务。

其次,非 Agentic 和 Agentic AI Workflows 的区别在于,前者使用静态的 AI 模型,而后者使用动态的 AI Agents。这使得 Agentic Workflow 比非 Agentic Workflow 更具适应性和动态性。

2、AgenticArchitectures与 Agentic Workflows 的区别

随着任何新兴技术的出现,都会涌现出大量新术语。虽然有些人可能会将 “Agentic 架构( Agentic Architectures)” 和 “Agentic Workflows” 这两个术语混合使用,但它们实际上有一个重要的区别。Agentic Workflow 是指 AI Agents 为实现特定目标而采取的一系列步骤。这些步骤可能包括使用大模型制定计划、将任务分解为子任务、使用互联网搜索等工具完成任务,以及使用大模型反思任务结果并调整整体计划。

与此同时,Agentic Architecture 是用于实现给定任务的技术框架和整体系统设计。Agentic Architecture 多种多样且富有创意,但始终包含至少一个具有决策和推理能力的 Agents、用于实现目标的工具,以及短期和长期记忆系统。

三、Agentic Workflows 的模式

回想一下,Agentic Workflow 是完成特定任务(也称为最终目标)所采取的结构化步骤序列。因此,当我们谈论 Agentic Workflow 时,我们谈论的是使 AI Agents 能够实现其最终目标的特定行为模式。

正如我们之前提到的,AI Agents 的核心组件在 Agentic Workflow 模式中起着关键作用。AI Agents 的推理能力促进了规划和反思模式,而它们使用工具与环境交互的能力则构成了工具使用模式的基础。

1、规划模式 Planning Pattern

规划设计模式允许 AI Agents 自主地将更复杂的任务分解为一系列更小、更简单的任务,这一过程被称为任务分解。任务分解能够带来更好的结果,因为它减少了大模型的认知负担,提高了推理能力,并最小化了幻觉和其他不准确性。

当实现最终目标的方法不明确,并且在问题解决过程中的适应性至关重要时,规划尤其有效。例如,一个被指示修复软件漏洞的 AI Agents 可能会使用规划模式将任务分解为子任务,如阅读漏洞报告、识别相关代码部分、生成潜在原因列表,最后选择特定的调试策略。如果第一次修复漏洞的尝试不成功,AI Agents 可以在执行后读取错误信息并调整其策略。

虽然规划可以帮助 AI Agents 更好地处理更复杂的任务,但与更确定性的 Workflow 相比,它也可能导致结果不那么可预测。因此,最好只在需要深入问题解决和多步推理的任务中使用规划模式。

2、工具使用模式 Tool Use Pattern

生成式大模型的一个显著限制是它们依赖于预训练数据,这意味着它们无法检索实时信息或验证超出其先前学习范围的事实。因此,当它们不知道答案时,可能会生成不真实的回答或 “猜测”,即产生幻觉。检索增强生成(RAG)通过为大模型提供相关的实时外部数据,帮助缓解这一限制,从而生成更准确且基于上下文的回答。

然而,工具使用超越了一般的 RAG,它允许大模型与现实世界进行动态交互,而不仅仅是从中检索数据。在 Agentic Workflow 中,工具使用模式通过允许 AI Agents 与外部资源和应用程序、实时数据或其他计算资源进行交互,扩展了 AI Agents 的能力。

常用工具包括 API、信息检索(例如向量搜索)、网络浏览器、机器学习模型和代码解释器。这些工具用于执行特定任务,如搜索网页、从外部数据库检索数据或读取或发送电子邮件,以帮助 AI Agents 实现其目标。

3、反思模式 Reflection Pattern

反思是一种强大的 AI Agents 设计模式,相对容易实现,并且可以显著提升 Agentic Workflows 的改进效果。反思模式是一种自我反馈机制,AI Agents 在最终确定响应或采取进一步行动之前,会迭代评估其输出或决策的质量。这些评估结果随后被用来优化 AI Agents 的方法,纠正错误,并改进未来的响应或决策。

当 AI Agents 不太可能在第一次尝试中就成功实现其目标时(例如编写代码),反思尤其有用。在这种情况下,AI Agents 可能会生成一段代码,在沙盒或执行环境中运行它,并将错误信息迭代反馈给大模型,同时提供改进代码的指令,直到代码成功执行为止。

反思的力量在于 AI Agents 能够评估自己的输出,并将这些洞察动态地整合到工作流中,从而在没有直接人类反馈的情况下实现持续改进。这些反思可以被编码到 AI Agents 的记忆中,从而在当前用户会话中能够更高效地解决问题,并通过适应用户偏好来实现个性化,从而改善未来的交互体验。


http://www.kler.cn/a/614183.html

相关文章:

  • 读DAMA数据管理知识体系指南34数据仓库和商务智能概念
  • 在 RK3588 多线程推理 YOLO 时,同时开启硬件解码和 RGA 加速的性能分析
  • bluecode-20240913_1_数据解码
  • 树莓派5智能家居中控:HomeAssistant全配置指南
  • uni-app:指引蒙层
  • Spring中的IOC及AOP概述
  • LeetCode 2360.图中的最长环:一步一打卡(不撞南墙不回头) - 通过故事讲道理
  • Python包管理完全指南:pip常用命令与最佳实践
  • mysql.8.4.4--初始化报错--libnuma.so.1缺失
  • 用Python打造智能宠物:强化学习的奇妙之旅
  • 《新凯来 :中国半导体设备制造行业从“跟随者”向“挑战者”的角色转变》
  • OpenAI API - 内置工具使用
  • 城电科技|零碳园区光伏太阳花绽放零碳绿色未来
  • 鸿蒙Next-集成HmRouter的路由模式
  • Spring Initializr搭建spring boot项目
  • 【数据结构】[特殊字符] 并查集优化全解:从链式退化到近O(1)的性能飞跃 | 路径压缩与合并策略深度实战
  • MDK中结构体的对齐、位域、配合联合体等用法说明
  • vivado IP学习 divider
  • MySQL 用户权限与安全管理
  • 无人机进行航空数据收集对于分析道路状况非常有用-使用无人机勘测高速公路而不阻碍交通-