当前位置: 首页 > article >正文

利用metaGPT多智能体框架实现智能体-2

1.一些帮助理解的概念

智能体
在MetaGPT看来,可以将智能体想象成环境中的数字人,其中

智能体 = 大语言模型(LLM) + 观察 + 思考 + 行动 + 记忆

这个公式概括了智能体的功能本质。为了理解每个组成部分,让我们将其与人类进行类比:

  1. 大语言模型(LLM):LLM作为智能体的“大脑”部分,使其能够处理信息,从交互中学习,做出决策并执行行动。
  2. 观察:这是智能体的感知机制,使其能够感知其环境。智能体可能会接收来自另一个智能体的文本消息、来自监视摄像头的视觉数据或来自客户服务录音的音频等一系列信号。这些观察构成了所有后续行动的基础。
  3. 思考:思考过程涉及分析观察结果和记忆内容并考虑可能的行动。这是智能体内部的决策过程,其可能由LLM进行驱动。
  4. 行动:这些是智能体对其思考和观察的显式响应。行动可以是利用 LLM 生成代码,或是手动预定义的操作,如阅读本地文件。此外,智能体还可以执行使用工具的操作,包括在互联网上搜索天气,使用计算器进行数学计算等。
  5. 记忆:智能体的记忆存储过去的经验。这对学习至关重要,因为它允许智能体参考先前的结果并据此调整未来的行动。

多智能体
多智能体系统可以视为一个智能体社会,其中

多智能体 = 智能体 + 环境 + 标准流程(SOP) + 通信 + 经济

这些组件各自发挥着重要的作用:

  1. 智能体:在上面单独定义的基础上,在多智能体系统中的智能体协同工作,每个智能体都具备独特有的LLM、观察、思考、行动和记忆。
  2. 环境:环境是智能体生存和互动的公共场所。智能体从环境中观察到重要信息,并发布行动的输出结果以供其他智能体使用。
  3. 标准流程(SOP):这些是管理智能体行动和交互的既定程序,确保系统内部的有序和高效运作。例如,在汽车制造的SOP中,一个智能体焊接汽车零件,而另一个安装电缆,保持装配线的有序运作。
  4. 通信:通信是智能体之间信息交流的过程。它对于系统内的协作、谈判和竞争至关重要。
  5. 经济:这指的是多智能体环境中的价值交换系统,决定资源分配和任务优先级。

任务
对于每一个任务,至少要明确两点:目标和期望。目标和期望都可以用自然语言去描述。

其他需要明确的是 上下文、回调、输出、使用的工具。

回调可以是一个python函数。使用的工具可以是一个python列表。

你可以用pydantic去约束输出。把大模型的模糊输出变为强制结构化输出。

2.单动作单智能体

如何去思考自定义一个智能体呢?一般都要从我们的目的出发,将实现目的的过程分解,然后得到动作,将动作赋予一个智能体,我们就得到了一个可以实现我们目的的智能体。
下面考虑这样一个问题”我们希望用自然语言编写代码“,那么就需要两个思考步骤:

  1. 定义一个编写代码的动作;
  2. 将该动作赋予智能体;
    然后我们就得到了可以解决该问题的一个单动作智能体。接下来看看具体实现:

定义动作:
在 MetaGPT 中,类 Action 是动作的逻辑抽象。用户可以通过简单地调用 self._aask 函数令 LLM 赋予这个动作能力,即这个函数将在底层调用 LLM api。

from metagpt.actions import Action

class SimpleWriteCode(Action):
    PROMPT_TEMPLATE: str = """
    Write a python function that can {instruction} and provide two runnnable test cases.
    Return ```python your_code_here ```with NO other texts,
    your code:
    """

    name: str = "SimpleWriteCode"

    async def run(self, instruction: str):
        prompt = self.PROMPT_TEMPLATE.format(instruction=instruction)

        rsp = await self._aask(prompt)

        code_text = SimpleWriteCode.parse_code(rsp)

        return code_text

    @staticmethod
    def parse_code(rsp):
        pattern = r"```python(.*)```"
        match = re.search(pattern, rsp, re.DOTALL)
        code_text = match.group(1) if match else rsp
        return code_text

定义角色:
在 MetaGPT 中,Role 类是智能体的逻辑抽象。一个 Role 能执行特定的 Action,拥有记忆、思考并采用各种策略行动。基本上,它充当一个将所有这些组件联系在一起的凝聚实体。目前,让我们只关注一个执行动作的智能体,并看看如何定义一个最简单的 Role。

import re
import os
from metagpt.roles import Role
from metagpt.schema import Message
from metagpt.logs import logger

class SimpleCoder(Role):
    name: str = "Alice"
    profile: str = "SimpleCoder"

    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        self.set_actions([SimpleWriteCode])

    async def _act(self) -> Message:
        logger.info(f"{self._setting}: to do {self.rc.todo}({self.rc.todo.name})")
        todo = self.rc.todo  # todo will be SimpleWriteCode()

        msg = self.get_memories(k=1)[0]  # find the most recent messages
        code_text = await todo.run(msg.content)
        msg = Message(content=code_text, role=self.profile, cause_by=type(todo))

        return msg

运行


async def main():
    msg = "write a function that calculates the sum of a list"
    role = SimpleCoder()
    logger.info(msg)
    result = await role.run(msg)
    logger.info(result)
    return result
    
        
rtn = await main()

输出如下:
在这里插入图片描述


http://www.kler.cn/a/519934.html

相关文章:

  • .NET9增强OpenAPI规范,不再内置swagger
  • 二十三种设计模式-享元模式
  • 【2025年数学建模美赛F题】(顶刊论文绘图)模型代码+论文
  • 安装最小化的CentOS7后,执行yum命令报错Could not resolve host mirrorlist.centos.org; 未知的错误
  • ray.rllib-入门实践-11: 自定义模型/网络
  • MySQL入门(数据库、数据表、数据、字段的操作以及查询相关sql语法)
  • MarsCode青训营打卡Day10(2025年1月23日)|稀土掘金-147.寻找独一无二的糖葫芦串、119.游戏队友搜索
  • 什么是 Token,Token 的作用是什么?
  • 突破与重塑:逃离Java舒适区,借Go语言复刻Redis的自我突破和成长
  • flutter-android混合编译,原生接入
  • 在 JavaScript 中调用 OpenAI 的接口初识
  • 3-scala的类
  • 自定义数据集使用框架的线性回归方法对其进行拟合
  • 第30章 测试驱动开发中的设计模式解析(Python 版)
  • 三年级数学知识边界总结思考-下册
  • GSI快速收录服务:让你的网站内容“上架”谷歌
  • 从Spring请求处理到分层架构与IOC:注解详解与演进实战
  • MYSQL数据库 - 启动与连接
  • 入门 Canvas:Web 绘图的强大工具
  • C#,入门教程(05)——Visual Studio 2022源程序(源代码)自动排版的功能动画图示
  • rust学习-rust中的格式化打印
  • 深度解读:近端策略优化算法(PPO)
  • 浅谈在AI时代GIS的发展方向和建议
  • Elasticsearch 性能测试工具 Loadgen 之 004——高级用法示例
  • c语言函数(详解)
  • Vue.js 高级组件开发