[论文阅读] | 智能体长期记忆
更新记录:
- 2024.11.2 人大高瓴长期记忆综述
文章目录
- 人大高瓴长期记忆综述
- 智能体与环境交互
- 记忆的来源/形式/操作
- 来源:(1)当前任务历史信息 (2)其他任务的信息 (3)外部知识
- 形式:如何表达记忆的内容,通过(1)文本 (2)参数(训练到模型里)
- 操作:读/写/管理
- 评估
- 不同场景下智能体记忆机制的实现
- 角色扮演类--记忆赋予角色鲜明的个性特征,使之区别于其他角色
- 写在后面
人大高瓴长期记忆综述
智能体与环境交互
- 过程通常包括三个步骤:(1)智能体从环境中获取信息存储到记忆中 (2)对存储的信息进行处理和抽取,使其更有价值 (3)根据记忆采取下一步行动
- 交互过程中,迭代的"智能体采取行动→环境给予响应→基于响应采取下一步行动",直到任务完成的过程称之为"trial"
- 示例:旅行规划和电影推荐(结合用户偏好-喜欢古建/喜欢晚上9点看电影)
记忆的来源/形式/操作
来源:(1)当前任务历史信息 (2)其他任务的信息 (3)外部知识
形式:如何表达记忆的内容,通过(1)文本 (2)参数(训练到模型里)
操作:读/写/管理
写入:抽取原始观察数据中重要内容写入
管理:提炼高层次的通用信息,提升智能体泛化能力(例如任务B中提炼出的:Alice喜欢在晚上观看科幻电影);合并相似信息减少冗余;遗忘不重要/无关信息减少负面影响
读取:选择支持智能体下一步操作的重要信息
评估
不同场景下智能体记忆机制的实现
角色扮演类–记忆赋予角色鲜明的个性特征,使之区别于其他角色
写在后面
思考:在纷繁多样的prompt框架下,我们能够做什么有意义和价值的工作呢?
坚持的动力:前段时间学校终于暂停了飞书账号,当时云文档有大量笔记没有做备份。后面经过一番联系终于找到靠谱的管理员老师,帮忙迁移其中的资料。于是决定还是要坚持记录自己的学习和思考过程,加油哇!