一篇大模型Agent记忆机制研究综述

转自:PaperAgent

基于大型语言模型(LLM)的智能体最近吸引了研究和工业社区的广泛关注。与原始的大型语言模型相比,基于LLM的智能体以其自我进化能力为特色,这是解决需要长期和复杂智能体-环境交互的现实世界问题的基础。支持智能体-环境交互的关键组件是智能体的记忆。尽管先前的研究提出了许多有前景的记忆机制,但它们分散在不同的工作中,缺乏一个系统性的综述来从整体视角总结和比较这些工作,未能抽象出共同和有效的设计模式以启发未来的研究。

图片

图片

智能体中的记忆是什么?

记忆的定义:智能体的记忆被定义为存储和回忆与环境交互过程中获得的信息的能力。这包括在同一试验中的信息、跨不同试验的信息,以及外部知识。

记忆的作用:记忆对于智能体理解环境、做出决策和从经验中学习至关重要。它允许智能体积累知识、处理历史经验,并检索有信息的知识以支持其行动。

记忆的来源:记忆内容可能来自以下来源:

内部试验信息:智能体与环境交互过程中的历史步骤。

跨试验信息:在多个试验中积累的信息,包括成功和失败的行动及其洞察。

外部知识:智能体可以通过API调用等手段获取的文本形式的外部知识。

记忆的形式:记忆可以以文本形式或参数形式存在。文本形式使用自然语言明确保留和回忆信息,而参数形式将记忆信息编码为参数,并隐式地影响智能体的行动。

记忆的操作:智能体的记忆操作包括记忆写作(记录信息)、记忆管理和记忆阅读(检索信息)。这些操作共同支持智能体的学习和决策过程。

图2:Agent记忆机制示例:(a) 智能体与环境交互过程中潜在试验的示例。(b) 记忆的读取、写入和管理过程的说明,其中虚线表示跨试验信息可以被整合到记忆模块中。

图片

图片

在图2例子中,智能体有两个任务:

(A) 为爱丽丝在2024年5月1日至5月3日期间在北京制定旅行计划,智能体需要(i) 购买往返机票,(ii) 根据爱丽丝的偏好确定几个景点,(iii) 安排这些景点的参观顺序。

(B) 在2024年5月10日为爱丽丝推荐一部电影,智能体需要(i) 确定爱丽丝有空看电影的时间,(ii) 根据爱丽丝的观看偏好选择一部电影。对于每个任务,在下面展示一个可能的试验(也在图2(a)中说明)。

[步骤 1] 智能体:我需要通过在线票务办公室预订2024年5月1日从上海到北京的航班,以及5月3日从北京返回上海的航班。环境(在线票务办公室):订单已确认。出发航班上午9:00起飞,您的票号是EK240501SX9021。返程航班下午4:30起飞,您的票号是LG240503FN6317。请准时到达机场搭乘您的航班。

[步骤 2] 智能体:我已经从《北京景点》杂志获取了外部知识。它显示长城、故宫和颐和园都很有名。根据爱丽丝的偏好,我认为她更喜欢古代建筑,所以我确定故宫和颐和园作为目的地。环境(爱丽丝):做得好!

[步骤 3] 智能体:现在,我需要为爱丽丝安排参观顺序。根据上面的信息,我建议她一到北京就参观颐和园,因为那里适合整个下午游玩并观看日落。然后,她第二天可以去故宫,这样会给她足够的时间。

最后,她可以在第三天返回上海休息。环境(爱丽丝):我喜欢这个计划。谢谢!

[步骤 1] 智能体:根据我以前为爱丽丝推荐电影的经验,她更喜欢在晚上9:00开始看电影,因为那时她已经完成工作。我应该问问爱丽丝那个时间她是否有空。环境(爱丽丝):当然,这是个好时间!

[步骤 2] 智能体:现在,我需要找到一些爱丽丝在Netflix上标记为“想看”的电影。环境(Netflix):爱丽丝的想看列表:《星际穿越》、《恐怖星球》和《鬼吹灯》。

[步骤 3] 智能体:由于爱丽丝晚上从不观看恐怖电影,《星际穿越》对她来说更合适。现在,我需要与爱丽丝确认这部电影。环境(爱丽丝):太棒了!我喜欢它!

从三个视角来看,记忆为智能体建立了认知基础,并且对于智能体的演化原理和应用是必要的,这为设计具有记忆机制的智能体提供了洞见。

认知心理学视角:记忆对于人类学习知识、形成社会规范、采取合理行为等心理过程至关重要。设计智能体以模仿人类的工作机制是自然且必要的,因此,对于智能体而言,设计记忆模块也是重要的。认知心理学的长期研究积累了许多有效的人类记忆理论和架构,这些可以支持智能体的更高级能力。

自我演化视角:为了在动态环境中完成不同的实际任务,智能体必须自我演化。在这个过程中,记忆对于以下方面至关重要:

经验积累:记忆的一个主要功能是记住过去的错误的规划、不当的行为或失败的经验,以便在未来处理类似任务时使智能体更有效。

环境探索:智能体必须记住历史信息,以更好地决定何时以及如何进行探索。

知识抽象:记忆的另一个重要功能是从原始观察中总结和抽象出高级信息,这是智能体适应性和泛化性的基础。

智能体应用视角:在许多应用中,记忆是智能体不可或缺的组成部分。例如,在对话智能体中,记忆存储有关历史对话的信息,这对于生成下一个响应至关重要。没有记忆,智能体就不知道上下文,无法继续对话。

智能体记忆如何实现?

图片

图片

记忆来源(Memory Sources):

内部试验信息(Inside-trial Information):指的是在单一试验中,智能体与环境交互过程中产生的信息。

跨试验信息(Cross-trial Information):涉及多个试验中积累的信息,如成功和失败的行动及其洞察。

外部知识(External Knowledge):智能体可以利用的文本形式的外部知识,如Wikipedia或其他在线数据库。

记忆形式(Memory Forms):

文本形式(Textual Form):信息以自然语言的形式明确保留和回忆。

参数形式(Parametric Form):记忆信息被编码为参数,并隐式地影响智能体的行为。

记忆操作(Memory Operations):

记忆写作(Memory Writing):智能体如何将感知到的信息部分存储为记忆,包括原始信息的存储和信息摘要。

记忆管理(Memory Management):智能体如何通过生成更高层次的记忆、合并相似的记忆条目和遗忘不重要或不相关的信息来处理存储的记忆信息。

记忆阅读(Memory Reading):智能体如何从记忆中提取信息以支持下一步行动,通常涉及计算当前上下文与记忆条目之间的相似性。

记忆源的总结。使用✓和×来标记相应的源是否在模型中采用。

图片

图片

记忆形式的总结。使用✓和×来标记相应的记忆形式是否在模型中采用。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/149178.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

10.安卓逆向-安卓开发基础-api服务接口设计1

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 内容参考于:图灵Python学院 本人写的内容纯属胡编乱造,全都是合成造假,仅仅只是为了娱乐,请不要盲目相信。 工…

实战精选 | 5分钟利用 OpenVINO™ 部署 Qwen2.5

点击蓝字 关注我们,让开发变得更有趣 作者 | 杨亦诚 英特尔 AI 软件工程师 排版 | 吴紫琴 OpenVINO™ Qwen2.5 是阿里通义团队近期最新发布的文本生成系列模型,基于更富的语料数据集训练,相较于 Qwen2,Qwen2.5 获得了显著更多的知识&#xff…

HSD AIM915 916 芯片调试

在车机显示 系统中,AIM915X和AIM916X作为车机和显示屏之间的传输芯片,车机的LVDS视频信号传到显示屏;控制信号如I2C、GPIO可实现双向透传; 一、设备树 开发平台:IMX6D 1、设备节点 2、timing参数 二、分辨率 1、修改为…

通过企业微信群机器人 发送群消息

1、添加群机器人,复制的webhook地址 2、 public static void main(String[] args) { String reqUrl "https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key6xdexxxxxxxxxxxxxxxxxxxxxxxxxxx"; String title "填…

FP7208:升压汽车车灯方案 高效稳定的电力支持

前言 近年来随着汽车的不断普及,车灯方面也在不断发展,车灯对于汽车不仅是外观件更是汽车主动安全的重要组成部分。灯光在保证照亮前部道路的同时,还要确保不对对面车辆产生眩目影响。同时需要针对不同路况和不同载荷引起的灯光偏离进行调整&…

入门数据结构JAVA DS——二叉树的介绍 (构建,性质,基本操作等) (1)

前言 二叉树的概念和性质 二叉树的基本概念 二叉树的种类 二叉树的性质 二叉树的构建存储与遍历 存储 构建 遍历 前序遍历 后序遍历 中序遍历 层序遍历 二叉树的基本操作 获取树中结点个数 获取叶子结点个数 获取第K层结点的个数 获取二叉树的高度 检测值为v…

【新书】从零构建大型语言模型,370页pdf

学习如何从零开始创建、训练和调整大型语言模型(LLMs) 在《从零构建大型语言模型》一书中,畅销书作者塞巴斯蒂安拉什卡(Sebastian Raschka**)将一步步指导你创建自己的LLM。每个阶段都有清晰的文字、图表和示例解释。…

【Python】生成dataframe的测试样例,用于测试一个或者多个dataframe

我们在处理dataframe测试时,发现,总需要重新构造一个新的dataframe,每次想找个现成的就想抓狂。 所以,为了方便随用随拿,我在这里直接保存一个直接生成dataframe 的方法。 1. 生成一个随机dataframe的方法&#xff1…

1688店铺装修模板1688店铺怎么装修1688装修模板1688店铺装修教程视频1688运营阿里巴巴店铺装修设计阿里店铺首页怎么装修产品分类效果

侧边栏装修效果,代码1688店铺怎么装修1688装修模板1688店铺装修教程视频1688运营阿里巴巴店铺装修设计阿里店铺首页怎么装修 工具是一秒美工助手

食家巷苦豆粉,香得很哟

苦豆粉,它看似普通,却承载着西北的厚重历史与浓郁风情。那一抹淡淡的绿色粉末,蕴含着大自然的馈赠和西北人民的智慧。 苦豆,这种生长在西北土地上的植物,经过精心研磨,变成了细腻的苦豆粉。它的味道独特&am…

python对文件的写入和追加

写入文件 1.打开文件 文件可以是不存在的,不存在就会创建 f open(./test.txt, w, encoding"utf-8")2.写数据到内存中 f.write("你好,世界")3.写到硬盘中 f.flush()#或者 close()有刷新的功能 f.close()整体代码 #打开文件 f …

鲲鹏计算这五年:硬生态基本盘稳住,才能放手进击软生态

文 | 智能相对论 作者 | 叶远风 数智化深入发展、新质生产力成为主旋律的当下,本土计算产业的发展被寄予越来越多的关注和期待。自2019年开启以来,鲲鹏计算产业生态已经整整走过5个年头。 因此,今年华为全联接大会的鲲鹏之夜,在…

还在用windows自带录屏?试试这三款录屏工具

作为一名办公室文员,我经常需要录制电脑屏幕来制作教程或者记录工作流程。在众多的录屏工具中,我尝试了四款不同的录屏工具,包括Windows自带录屏工具。今天,我就来跟大家分享一下我的使用体验,希望能帮助到和我有同样需…

在视频上绘制区域:使用Vue和JavaScript实现交互式画布

在数字时代,交互式媒体内容的创建和消费变得越来越普遍。特别是视频内容,它不仅提供了视觉信息,还允许用户与之互动,从而增强了用户体验。本文将介绍如何使用Vue.js框架和JavaScript创建一个交互式组件,该组件允许用户…

谷歌老户的优势及优化策略,增加曝光度方法介绍

谷歌老户(已存在一段时间并积累了历史数据的账户)通常具有较高的权重和稳定性,这使其在投放广告时可以更快速地增加流量并保持稳定的表现。以下是一些策略和建议,帮助您最大化利用谷歌老户的优势。 一、它的优势: 账…

Cherry Studio:开启AI智能工作的新篇章

引言 在当今快速发展的科技时代,如何高效利用人工智能技术提升工作效率,成为了各行各业专业人士的共同追求。🍒 Cherry Studio 正是为此而生,它是一款支持多模型服务的桌面客户端,内置了超过 30 个行业的智能助手&…

MDS130-16-ASEMI充电桩专用MDS130-16

编辑:ll MDS130-16-ASEMI充电桩专用MDS130-16 型号:MDS130-16 品牌:ASEMI 封装:DXT-5 批号:2024 现货:50000 最大重复峰值反向电压:1600V 最大正向平均整流电流(Vdss):130A …

VOC2007数据集

目标检测入门code 文件目录 下载数据集——在官网下载VOC2007数据集 下载训练数据集 TRAIN data 下载测试数据集 TEST data 解压数据集 解压——训练数据集,在服务器上,目录为VOCdevkit 部分文件目录 全部文件总目录 解压——测试数据集 (…

828华为云征文|云服务器Flexus X实例评测体验之搭建MySQL数据库

全文目录: 一、前言二、Flexus X云服务器2.1 Flexus X实例概述2.2 为什么选择 Flexus X实例? 三、购选及登录教程3.1 如何选购Flexus X?3.2 登录方式选择 四、安装 MySQL4.1 安装MySQL依赖库4.2 下载MySQL安装包4.3 上传MySQL安装包4.4 解压M…

3D 模型GLTF、GLB格式文件介绍使用

一、介绍 GLTF(GL Transmission Format)和 GLB(GL Binary)是用于在 Web 和各种应用程序中传输和加载 3D 场景和模型的开放标准格式。它们由 Khronos Group 开发,旨在提供一种高效、可扩展且易于使用的 3D 内容格式。以…