当前位置: 首页 > article >正文

【AIGC】让AI像人一样思考和使用工具,reAct机制详解


reAct机制详解

  • reAct是什么
  • reAct的关键要素
  • reAct的思维过程
  • reAct的代码实现
    • 查看效果
    • 引入依赖,定义模型
    • 定义相关工具
    • 集合工具创建代理
    • 启动测试
    • 完整代码
  • 思考

reAct是什么

reAct的核心思想是将**推理(Reasoning)和行动(Acting)**结合起来。具体来说,reAct 赋予了 AI agent 思维链Cot的思考能力和使用工具Action的能力。对于一个复杂问题agent首先利用其强大的推理能力对环境进行分析和理解,识别出需要解决的问题和可用的资源。然后,它根据推理结果制定行动计划,并选择合适的工具或方法来执行计划。最后达到像人一样分析和使用工具最后解决问题的效果。

reAct的关键要素

  • 强大的推理能力
  • 丰富的工具库
  • 灵活的行动策略
  • 持续的反馈机制

reAct的思维过程

举个例子比如问模型一个问题羊村旁边的地方是什么?它的面积加上它的面积是多少?,正常模型肯定回答不了,可是添加上reAct他就被赋予了思考和使用工具获取信息的能力,分析过程大概如下:

分析1:我需要先搜索羊村旁边的地方,然后获取该地方的面积,最后计算面积的总和,首先我得先知道羊村旁边是什么地方

行动1:调用地点搜索工具

分析2:获取到的地点是狼堡,我需要搜索狼堡的面积,然后计算面积的总和

行动2:调用地点面积搜索工具

分析3:获取到面积是500,我已经获取了狼堡的面积,现在需要计算面积的总和。

行动3:调用数字相加计算工具(如果数字比较复杂可能需要专业的数学工具计算)

分析4:计算出结果是1000

行动4:进行最终答复:羊村旁边的地方是狼堡,狼堡的面积是500,加上它的面积是1000。

就这样模型通过reAct完成了一整个复杂问题的拆解和逐步解决。我们可以通过代码来实现并查看一整个过程

reAct的代码实现

我们用langChain搭配deepseek模型去实现reAct的一整个过程,我们先来看看最终结果。

查看效果

在这里插入图片描述

可以看到利用reAct机制LLM确实跟我们预想的一样完成了推理和使用工具。下面我们来看实现.

引入依赖,定义模型

注意key换成deepseek的key

from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.memory import ConversationBufferMemory
from langchain.tools import BaseTool
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    model='deepseek-chat', 
    openai_api_key='xxx',
    openai_api_base='https://api.deepseek.com',
    max_tokens=4096
)

定义相关工具

# 定义数字计算工具
class SumNumber_tool(BaseTool):
    name = "数字相加计算工具"
    description = "当你被要求计算数字相加时,使用此工具"

    def _run(self, a, b):
        return a + b  # 直接返回两个数的和
        

# 模拟地点搜索工具(实际使用可以调用内置的google-serper)
class PlaceSearch_tool(BaseTool):
    name= "地点搜索工具"
    description = "当你需要搜索地点时,使用这个工具"

    def _run(self, query):
        return "狼堡"
    
# 创建地点面积搜索工具
class AreaSearch_tool(BaseTool):
    name= "地点面积搜索工具"
    description = "当你需要搜索地点面积时,使用这个工具"

    def _run(self, query):
        return 500

集合工具创建代理

# 工具集合
tools = [SumNumber_tool(), PlaceSearch_tool(), AreaSearch_tool()]
# 提示词,langchain hub内置提示词,之后文章会再做详细分析
prompt = hub.pull("hwchase17/structured-chat-agent")
# 定义AI Agent
agent = create_structured_chat_agent(
    llm=model,
    tools=tools,
    prompt=prompt
)
# 记录上下文
memory = ConversationBufferMemory(
    memory_key='chat_history',
    return_messages=True
)
# 创建一个代理执行器
agent_executor = AgentExecutor.from_agent_and_tools(
    agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True
)

启动测试

# 测试场景
agent_executor.invoke({"input": "羊村旁边的地方是什么?它的面积加上它的面积是多少?"}) 

完整代码

from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.memory import ConversationBufferMemory
from langchain.tools import BaseTool
from langchain_openai import ChatOpenAI

# 模型
model = ChatOpenAI(
    model='deepseek-chat', 
    openai_api_key='xxx',
    openai_api_base='https://api.deepseek.com',
    max_tokens=4096
)

# 定义数字计算工具
class SumNumber_tool(BaseTool):
    name = "数字相加计算工具"
    description = "当你被要求计算数字相加时,使用此工具"

    def _run(self, a, b):
        return a + b  # 直接返回两个数的和
        

# 模拟地点搜索工具(实际使用可以调用内置的google-serper)
class PlaceSearch_tool(BaseTool):
    name= "地点搜索工具"
    description = "当你需要搜索地点时,使用这个工具"

    def _run(self, query):
        return "狼堡"
    
# 创建地点面积搜索工具
class AreaSearch_tool(BaseTool):
    name= "地点面积搜索工具"
    description = "当你需要搜索地点面积时,使用这个工具"

    def _run(self, query):
        return 500

# 工具集合
tools = [SumNumber_tool(), PlaceSearch_tool(), AreaSearch_tool()]
# 提示词,langchain hub内置提示词,之后文章会再做详细分析
prompt = hub.pull("hwchase17/structured-chat-agent")
# 定义AI Agent
agent = create_structured_chat_agent(
    llm=model,
    tools=tools,
    prompt=prompt
)
# 记录上下文
memory = ConversationBufferMemory(
    memory_key='chat_history',
    return_messages=True
)
# 创建一个代理执行器
agent_executor = AgentExecutor.from_agent_and_tools(
    agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True
)


# 测试场景
agent_executor.invoke({"input": "羊村旁边的地方是什么?它的面积加上它的面积是多少?"})

思考

reAct是AI agent很重要的一个概念,它赋予了agent能够逐步推理和执行任务的能力。通过将复杂的任务分解为一系列简单的步骤,并通过使用工具去解决问题,让agent能够更高效地解决问题,最终让agent像人一样能够处理复杂问题。


http://www.kler.cn/a/354546.html

相关文章:

  • 基于vue的商城小程序的毕业设计与实现(源码及报告)
  • Ubuntu网络连接问题(笔记本更换wifi后,虚拟机连不上网络)
  • 2025年01月09日Github流行趋势
  • 递归构建树菜单节点
  • 计算机网络之---数据传输与比特流
  • IvorySQL 升级指南:从 3.x 到 4.0 的平滑过渡
  • 基于Springboot+Vue的农业收成管理系统(含源码数据库)
  • SpringBoot驱动的高校学科竞赛平台开发指南
  • HarmonyOS NEXT开发 ArkTS自定义组件
  • OPENSSL-2023/10/31学习记录(单向散列函数)
  • 【网络安全】-web安全-基础知识梳理
  • Junit单元测试时提示:Method should have no parameters
  • qiankun 应用之间数据传递
  • linux 开发机与测试机建立 ssh 隧道
  • Vue3的Composition组合式API(computed计算属性、watch监视属性、watchEffect函数)
  • TDengine 3.3.3.0 发布:新增 MySQL 函数与 MongoDB 数据源支持
  • 鸿蒙网络编程系列7-TLS安全数据传输单向认证示例
  • c# FrozenDictionary
  • 基于php的网上购物商场的设计
  • Java第二阶段---09类和对象---第一节 类和对象
  • 【c++ 并发编程】
  • 问题:uniApp 开发测试中的页面回弹效果的问题
  • python基于图片内容识别的微信自动发送信息(对其中逻辑修改一些可以改为自动化回复)
  • 智能伺服,精准控制:匠芯创科技M6800系列方案助力工业升级
  • Redis——事务
  • OpenAI研究揭示ChatGPT的性别和种族偏见