产品经理学习——AI Agent 智能化
Agent理论与策略分析——主要是理解Agent的一些原理以及有哪些Agent的认知框架,以及如何运用它。
大语言模型可以接受输入,可以分析、推理,可以输出文字、代码、媒体
AI agent是基于LLM,能够自主理解,自主规划决策,执行负责任务的智能体。
Agent的设计目的是为了处理那些简单的语言模型可能无法直接解决的问题,尤其是当这些任务设计到多个步骤,或者需要外部数据的情况。
LLM:接受输入,思考,输出
在人类大脑中也存在LLM,(接受输入,思考,输出)+记忆+工具+规划等等形成了Agent

决策流程图
感知
感知:从外部环境接收到输入,把感知的内容交给LLM,通过LLM的规划能力,对任务进行拆解,根据任务的不同规划进行执行(行动)。但并不知道反馈是好是坏,所以会去反思观察。
举例:有一个应用场景,假设有一个智能家居系统,它的任务是根据家庭成员的需求调节室内环境,比如温度和灯光。
感知:用户通过语音助手说:“我感觉有点冷,请把温度调高一些”
智能家居系统通过语音识别和情感分析技术“感知”到用户觉得房间温度太低,需要提高温度。
规划
规划:系统根据用户的需求,规划出下一步的行动,决定如何调节房间的温度。
系统的规划:1.检查当前室内的温度 2.根据用户的偏好和当前温度决定升高几度合适
3.调整温度设置,并告知用户
行动
行动:系统执行计划的行动,首先检查当前温度。
根据用户的偏好,将温度调整,并通过语音助手反馈给用户。
观察:系统观察房间温度的变化,以及用户的反馈,如果用户在几分钟后再次说:“现在刚刚好”系统感知到环境调节成功。
如果用户还觉得冷,系统可能会调整计划,进一步调高温度。
循环
循环:在每个阶段,智能家居系统都可能根据环境变化和用户反馈调整操作
在做规划的时候,要把大型任务分解成子任务,并规划执行任务的流程,智能体会对任务执行的过程进行思考和反思,从而觉得是继续执行任务或判断任务完结并终止运行。
规划过程:
- 首先思考怎么完成这任务
- 观察手头上所拥有的工具,以及如何使用这些工具高效达成目的
- 再会把任务拆分成子任务
- 在执行任务的时候,对任务的执行过程进行反思和完善,吸取教学以完善未来的步骤。
思维链和思维树
Agent在这个过程中赋予智能体思维能力,在Agent中通过思维链,思维树来完成。
思维链(Chain of Thoughts,CoT):一种标准的提示技术,能显著提升LLM完成复杂任务的效果。是一种线性思维方式,LLM把问题分解成多个步骤,一步步思考和解决,使输出的结果更加精准。
思维树(Tree of thought,ToT):对CoT的进一步扩展,推理出多个分支,拓扑展开形成一棵思维树,评估每个推理分支对问题解决的贡献,使用广度优先搜索或深度优先搜索。
图片来源于网络
记忆:
生活中的记忆:
1.感觉记忆:大脑具有记忆功能,记忆的最早阶段提供原始刺激结束后保留感官信息的印象的能力,感受记忆通常只有几秒钟
2.短期记忆:这是一种持续时间较短的记忆,能够暂时存储和处理优先数量的信息。
3.长期记忆:这是一种持续时间较短的记忆,可以存储大量信息,从几分钟到几十年,长期记忆可以进一步分为显性记忆和隐性记忆,显性记忆可以有意识的回忆和表达的信息,如情景记忆;隐性记忆一般是无意识的,涉及到技能和习惯,如某项技能。
智能设备中的记忆
1.形成记忆:大模型在大量数据的基础上进行预训练,在预训练中,大模型通过调整来学习理解和生产人类语言,这可以被视为记忆的形成过程
2.短期记忆:在当前任务中所产生的信息,比如某个工具或某个子任务执行的结果,会写入短期记忆中,在任务完结后进行清空
3.长期记忆:持续时间较长的记忆,一般指外部的知识库,通常使用向量数据库来存储。