大模型Agent记忆机制深度解析

2025/08/19·StepFun can make mistakes, check important info.

大模型基于agent记忆的调研

Requirement clarification

我需要理解用户对"大模型基于agent记忆的调研"这一需求的具体方向和期望。这个主题涉及大模型与agent记忆的结合，但需要进一步明确调研的具体方面。

从用户的简短描述来看，这可能是关于大模型如何实现或增强agent的记忆能力的研究。这个领域涉及多个方面，包括长期记忆机制、知识存储与检索、上下文学习等。

我需要了解用户希望调研的具体方向，例如是技术实现、最新研究进展、应用场景，还是比较不同方法的优缺点。同时，用户可能需要特定深度的信息，如学术研究级别还是产品应用级别。

基于这些考虑，我需要向用户澄清几个关键点：

您希望调研的具体方向是什么？(如技术实现、最新研究进展、应用场景等)
您需要什么深度的信息？(如学术研究级别、产品应用级别)
您对调研结果有特定格式或结构要求吗？

1. 最新研究进展、应用场景以及技术实现 2. 优先产品应用级别，再学术研究级别 3. 无

好的，这是为您制定的关于“大模型基于Agent记忆”的调研计划。

Research plan

在Google Scholar、arXiv、Towards Data Science等平台检索，明确“大模型Agent记忆”的核心定义、关键类型（如短期记忆、长期记忆）及其在智能代理中的作用。
调研实现Agent记忆的主流技术方案，在GitHub、LangChain及LlamaIndex官方文档中查找向量数据库、知识图谱等在产品级应用中的实现方法。
在TechCrunch、VentureBeat等科技媒体及主流AI产品官网中，搜集基于记忆的Agent在个性化推荐、智能客服、复杂任务处理等领域的具体应用案例和产品。
在arXiv、Google Scholar及Papers with Code网站上，检索近两年关于Agent记忆机制的最新研究论文和综述，重点关注记忆更新、遗忘机制和多模态记忆等前沿方向。
综合分析搜集到的信息，梳理技术实现、应用场景与研究进展三者间的关联，形成一个完整的知识框架。
根据分析结果，撰写一份结构化报告，分别阐述大模型Agent记忆的技术实现路径、典型的产品级应用场景，以及最新的学术研究方向和成果。

开始研究

Deep Research

让我开始搜索相关信息。

大模型 Agent 记忆机制综述

文件

[PDF] A survey on large language model based autonomous agents

知乎

尽管先前的研究提出了许多有前景的记忆机制，但它们分散在不同的工作中，缺乏一个系统性的综述来从整体视角总结和比较这些工作，未能抽象出共同和有效的设计 ...

知乎

基于大语言模型（LLM）的智能体最近引起了研究界和工业界的广泛 ... 本篇综述对基于LLM 的智能体的记忆机制进行了系统的回顾，其中重点关注三 ...

知乎

本系列工作第一作者张泽宇，中国人民大学博士生，研究方向为大语言模型智能体的记忆机制和个性化；谭浩然，中国人民大学硕士生，研究方向为大语言模型智能体。陈旭，中国人民大学预聘副教授，研究方向包括大语言模

火山引擎开发者社区

图2：Agent记忆机制示例：(a)智能体与环境交互过程中潜在试验的示例。(b)记忆的读取、写入和管理过程的说明，其中虚线表示跨试验信息可以被整合到记忆模块中。在图2例子中，智能体有两个任务： (A)为爱丽丝在2024年5月1日至5月3日期间在北京制定旅行计划，智能体需要(i)购买往返机票，(ii)根据爱丽丝的偏好确定几个景点，(iii)安排这些景点的参观顺序。(B)在2024年5月10日为爱丽丝推荐一部电影，智能体需要(i)确定爱丽丝有空看电影的时间，(ii)根据爱丽丝的观看偏好选择一部...

稀土掘金

AI Agent（智能体）是基于LLM（大语言模型）构建的具备环境感知→决策推理→行动执行完整能力链的智能系统。Agent能够模拟独立思考过程，灵活调用各类工具，逐步达成预设目标。与单纯的语言模型相比，其核心特征在于：自主性：无需人工干预的闭环运行工具调用：API/插件/代码解释器使用能力记忆机制：短期记忆+长期记忆的复合架构目标导向：通过Reward机制

飞书

**记忆的形式**：记忆可以以文本形式或参数形式存在。文本形式使用自然语言明确保留和回忆信息，而参数形式将记忆信息编码为参数，并隐式地影响智能体的行动。

CSDN技术社区

【老刘说NLP20250323技术进展早报】围绕大模型微调工具ZO2、文档处理工具PdfCraft，claude-think-tool，Agent记忆，svg文本转图。qwen3-omni开源预测，及平日学习心得等话题，供各位参考。1、关于大模型微调的轮子进展传统的基于一阶优化器的方法(如SGD)在模型规模扩大时会显著增加内存。主要体现在计算和通信操作的多次重复，每次前向和后向传播都需要传输相同的参数数据，增加了通信量和延迟；每次...

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTg0MzQ0OTQ1L2U1LzNkLzVlL2U1M2Q1ZTUxMTFkNTU0YzAxN2Y3MTczMzQyMzIwOWFjLmljbw==&sign=yx:UtH2RV7K--znAp5InyYMI62HGO8=&tv=400_400

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDI1MDExMDEwMzcwNC1jdXhsaXd4Z2V4MW45Z21jd3RhZ3p3cmUwMDlmbjN5cC5wbmc=&sign=yx:arsntQd0-eZDuX3Zf7XR6krPj_E=&tv=400_400

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTg0NDM0MjA4Lzg4LzJkLzIyLzg4MmQyMjNjZDQwYTU0NTUzYWFhOWQ2MTk0MjkzYTkyLmljbw==&sign=yx:3DqV4OhRbkLh-tyg8wPgSAAnD-0=&tv=400_400

View all 16 sources

我将开始对"大模型基于Agent记忆的调研"进行深入研究。首先，我需要了解大模型Agent记忆机制的基本概念和研究现状。

大模型Agent记忆机制分类实现方式

文件

[PDF] (19)国家知识产权局

文件

[PDF] (19)国家知识产权局

36氪

AI Agent的记忆分类 · 程序记忆（Procedural Memory）：存储⽣产系统本⾝Agent⾏为的规则集和程序。 · 语义记忆（Semantic Memory）：存储一些基础知识、世界知识。

点石科技

稀土掘金

知乎

LLM本质上是无状态的模型，每次调用都像一次“短暂失忆”。为了让 AI Agent真正理解上下文、具备个性化交互和任务持续性，引入记忆系统至关重要。本文将从技术与架构角度出发，系统介绍构建短期和

知乎

流程记忆（Procedure Memory）：代表技能，存储了所掌握的技能。以上是常见的几种记忆分类方法，这几个分类方法 ... 方式，反映了心理学中的人类记忆模型。这个 ...

View all 18 sources

我需要进一步了解大模型Agent记忆机制的具体实现方式和技术架构。

大模型Agent记忆机制技术实现向量数据库

文件

[PDF] (19)国家知识产权局

知乎

作者借鉴人类记忆机制，提出了一个创新的Agentic 记忆架构设计方案，包含记忆路由器、短期记忆模块和长期记忆模块。这个架构不仅可以处理语义记忆，还能通过 ...

SegmentFault 思否

编者按：当 AI Agent 执行长期任务时，如何有效管理和存储它们的"记忆？向量数据库真的能满足所有 AI Agent 的记忆需求吗？我们今天为大家带来的文章中，作者指出当前主流的向量数据库虽然能够有效处理对话记忆，但无法完全满足 Agentic AI 系统在长期任务执行过程中的多样化记忆需求。文章首先介绍了 Agentic AI 系统的基本概念，以营销案例说明了...

飞书

由于chatpgt的发展，除了基础的问答需求，利用chatgpt完成一系列复杂任务的需求也应用而生，产生了很多关于ai agent的应用框架，具体应用如下图，包括开源和商业的。

知乎

记忆提取通常通过检索来实现，具体技术实现包括全文检索、向量检索 ... 记忆片段，这些记忆片段会通过Embedding 存储到向量数据库内。当前对话的 ...

东方财富网

7月4日，腾讯云正式发布AI 原生（AI Native）向量数据库Tencent Cloud VectorDB。该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景，是国内首个从接入层、计

51CTO

因此在 AI 大模型的推理基础上，通过 RAG、Agent、MCP、Function Calling、知识库、向量数据库、知识图谱等技术手段实现了真正的 AGI（通用人工智能）。这些技术到底有哪些区别和联系，下图作了横向对比，接下来我们详细剖析。1、大语言模型（LLM）大语言模型（LLM）是通过深度学习方法，利用庞大的文本数据集进行训练的机器学习...

搜狐网

而向量数据库作为大模型的的“外部记忆外挂”，承担了起了通过对本地知识进行语义检索，补全大模型落地最后一块短板的角色。也是在这一过程中，RAG（Retrieval-Augmented Generation,检索增强生成）作为大模型结合向量数据库的经典搭配范式，成为了继电商推荐、自动驾驶之后，向量数据库爆发的又一超级场景。然而，到了 2025 年，在与雷峰网交流时，Zilliz 的 CE...

View all 16 sources

现在我将继续深入研究大模型Agent记忆机制的技术实现方式。

大模型Agent记忆机制短期记忆长期记忆实现方法

文件

[PDF] (19)国家知识产权局

知乎

短期记忆就是上下文学习（in-context learning），非常短且影响范围有限，受到Transformer的上下文窗口长度的限制。长期记忆作为智能体在查询时可用的外部 ...

SegmentFault 思否

经过研究和实践，我把 AI Agent 的记忆分成了三个层次：短期记忆：对话上下文工作记忆：当前任务相关的信息长期记忆：持久化的知识库就像人类大脑一样，这三种记忆各有特点和用途。短期记忆：对话上下文先从最基础的短期记忆开始。实现起来大概是这样的： class ConversationMemory:def_init_(self,max_tu...

稀土掘金

通过大模型提示工程（如ReAct、CoT推理模式）实现，使Agent能够精准拆解任务，分步解决。记忆（Memory）：包括短期记忆和长期记忆。短期记忆用于存储会话上下文，支持多轮对话；长期记忆则存储用户特征、业务数据等，通常通过向量数据库等技术实现快速存取。工具（Tools）：Agent感知环境、执行决策的辅助手段，如API调用、...

知乎

今日头条

飞书

长期记忆：长期记忆为代理提供了长期存储和召回（无限）信息的能力，它们通常通过利用外部的向量存储和快速检索来存储和召回（无限）信息。使用工具. 代理通过学会调用外部API来 ...

知乎

3、短期记忆（Short-Term Memory）. 实现短期记忆的最直接方法是使用模型的上下文窗口，它本质上是LLM 可以处理的token数。

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIzMTEwODEwMzAyOS16YWI2NjE3cmx0eG1xNHphMW55a2MyN2kxeDlsa29kNy5qcGc=&sign=yx:gqpaDq8m183GTruIwpTTQTQVG88=&tv=400_400

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTYyODEzMjI0L2I0LzExL2Y3L2I0MTFmN2ExMGZlNzgxYzNhNjMwYzYxYWU2NmE0ODY2LnBuZw==&sign=yx:VnmFtuBPyzBrSG70neamT35QLU4=&tv=400_400

View all 16 sources

已掌握的信息

核心概念与分类: Agent记忆是其从交互中存储和检索信息以指导未来行动的能力。核心分类借鉴了人类认知科学，主要分为短期记忆（工作记忆）和长期记忆。短期记忆通常通过模型的上下文窗口（In-Context Learning）实现，容量有限；长期记忆则依赖外部存储，以实现持久化和跨会话记忆。长期记忆又可细分为语义记忆（事实知识）、情节记忆（事件经验）和程序性记忆（技能流程）。
技术实现架构: 主流的记忆架构是混合式/分层式的。
- 短期记忆实现: 主要采用**滑动窗口（Sliding Window）或缓冲区（Buffer）**的方式，在内存中维护一个固定大小的对话历史队列，以保持上下文连贯性。
- 长期记忆实现: 核心技术是向量数据库（如FAISS, Pinecone, Milvus），通过将信息嵌入（Embedding）为向量，实现高效的语义相似度检索。此外，知识图谱用于存储结构化的关系数据，传统数据库（SQL/NoSQL）和缓存（Redis）也常被组合使用，以平衡成本、效率和数据类型的多样性。
- 记忆操作: 记忆的写入、读取（检索）和管理（如压缩、遗忘）是关键操作。例如，通过LLM对长对话进行摘要后存入长期记忆，是一种常见的压缩方法。
研究现状与挑战: 现有研究已经从理论探讨走向了工程实践，出现了如LangChain、LlamaIndex等提供记忆模块的开发框架。然而，单纯的向量数据库无法满足所有记忆需求，尤其是在处理程序性、情节性等复杂记忆时存在局限。因此，如何设计更精细的记忆更新、遗忘机制，以及如何评估记忆系统的有效性（如LoCoMo基准测试），是当前的研究热点。同时，自我进化Agent的概念也强调了记忆在Agent长期学习和能力提升中的核心作用。

下一步行动计划

系统性调研产品级应用案例: 深入分析已落地的AI Agent产品或知名的开源项目（如Character.ai, MetaGPT, OpenDevin），探究它们具体的记忆系统架构。重点关注它们如何组合使用不同记忆技术（如向量数据库、知识图谱、缓存）来解决实际问题，例如实现个性化、处理复杂任务或维持长期角色一致性。信息来源可参考相关产品的官方博客、技术文档、GitHub仓库以及主流科技媒体（如TechCrunch, The Verge）的深度报道。
聚焦前沿研究方向与挑战: 检索近两年顶级AI会议（如NeurIPS, ICML, ICLR）和预印本网站（arXiv）上的最新论文，专门研究以下前沿课题：
- 记忆更新与遗忘机制: 探索Agent如何智能地更新和遗忘记忆，以避免信息过时或冗余，并解决“灾难性遗忘”问题。
- 多模态记忆: 研究Agent如何存储和融合来自文本、图像、声音等多种模态的记忆。
- 记忆与Agent的自我进化: 深入理解记忆如何驱动Agent的长期学习、反思和能力进化。
构建全面的技术与应用框架: 综合所有信息，梳理出一套完整的知识框架。该框架将清晰地展示从“记忆的理论基础”到“核心技术实现”，再到“具体应用场景”和“未来研究方向”的逻辑脉络。计划使用可视化图表来呈现不同记忆机制的对比、混合记忆系统的架构图以及技术演进的时间线。
撰写结构化研究报告: 基于构建的知识框架，撰写一份图文并茂的深度研究报告。报告将包含以下核心章节：
- 引言: 概述Agent记忆的重要性及研究背景。
- 核心概念与分类: 详细阐述不同记忆类型的定义与功能。
- 技术实现深度解析: 剖析主流的记忆架构和技术栈，并附上架构图和技术对比表。
- 典型应用案例分析: 精选2-3个代表性产品进行案例研究。
- 前沿进展与未来展望: 总结最新的学术研究成果，并探讨未来面临的挑战与发展趋势。

大模型Agent记忆机制应用案例 Character.ai MetaGPT OpenDevin

知乎

简单的Agent实现流程：仅需指定角色描述、LLM名称、工具名列表，即可实现一个Agent应用，框架内部自动实现工具使用、规划、记忆等工作流的编排。丰富的模型和工具：框架内置 ...

上海东方财富证券投资咨询有限公司

大模型时代的AI AGENT = LLM + 规划能力+ 记忆+ 工具。AI领域AGENT概念由来已久，这一轮LLM给AI AGENT提供了突破性技术方案，对AI AGENT性能表现至关 ...

飞书

一个基于大模型的AI Agent 系统可以拆分为大模型、规划、记忆与工具使用四个组件部分。OpenAI 的应用研究主管Lilian Weng 撰写了一篇博客，认为AI Agent 可能会成为新时代的 ...

机器之心

> 热门通用大模型 Agent 平台。今年 3 月，「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是，Devin 并不只是辅助编程的角色，而是能够独立地、

知乎

机器之心报道，编辑：陈陈、泽南。今年 3 月，「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是，Devin 并不只是辅助编程的角色，而是能够独立地、端

m.betteryeah.com

深度解析AI Agent与大模型技术，涵盖原理（感知-决策闭环）、架构（感知/决策/执行/记忆模块）、关键技术（稀疏注意力/外部记忆）、应用场景（智能助手/客服/工业决策）及未来趋势，包含“AI Agent工作原理”“大模型与AI Agent架构设计”“AI Agent技术发展...

m.betteryeah.com

作为参与过金融、制造、零售三个行业大模型Agent落地的技术人，我深刻意识到：开发大模型Agent不是“调个API、写几行代码”就能完成的，它需要从业务定位到持续迭代的完整方法论。今天这篇文章，我就结合2025年上半年最新行业实践，拆解 10步打造可落地的智能应用系统，帮你避开“为Agent而Agent”的坑。Step1：明确业务场景与大模型Agent定位—从“伪需求”到“真价值”的关键一跃很多团队在启动大模型Agent

搜狐网

1）陪伴类智能体强调情感情商等人类特征，具有“人格”，且能够记住与用户的历史交流，代表应用如PI、Character ai、replica、glow等。我们认为国内情绪消费市场仍有较大想象空间，陪伴类智能体或受益于情绪消费趋势红利，成为LLM时代重要的AI原生应用。我们预计陪伴类智能体大部分商业价值集中在供给方而非平台，我们更加看好具备丰富IP储备或者能让用户定制智能体的玩家。2）交互智能体：强调与环境交互的能力，智能体之间/与虚拟世界...

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTg0NDEzNTM0L2QyLzYxL2M1L2QyNjFjNWZjZWUxZjM3NmU1MDhjNTc4ZTc5MzZjNzUzLmljbw==&sign=yx:H7qcOHF8NxV5f_kB4e1iXa6Q_CA=&tv=400_400

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTg0MzI5MTIyL2ZhLzdiL2QwL2ZhN2JkMGM2MTlhODM2NmIwNzNkNWM3ZWQ0ZWFhNWUwLmljbw==&sign=yx:C1HunXUgWw_Hnydsxo7hNSZ08AU=&tv=400_400

View all 16 sources

我需要继续深入研究大模型Agent记忆机制的具体应用案例。

Character.ai 记忆机制实现方式用户个性化

文件

[PDF] Characteristic AI Agents via Large Language Models

知乎

记忆能力：平台开发了高效的角色记忆和状态管理系统，使AI能够记住对话历史，保持上下文连贯性，从而与用户建立长期关系，77%的用户更喜欢能记住之前对话的角色 ...

腾讯

更强的记忆和个性化能力，团队从模型架构层面对记忆进行优化，还没达到最理想水平，但我们倾向于认为能够比其他团队做得更好。活跃用户量和用户数据积累能在 ...

51cto.com

本指南将深入剖析Character AI的运行机制、功能特性、存在的局限性，同时将其与ChatGPT、Gemini、Janitor AI及Inworld等其他平台进行对比分析。

知乎

在人工智能的浪潮中，个性化体验已成为创新的关键。而随着各种各样的模型迭代更新，如何为AI应用提供持久、智能的记忆系统逐渐成为了一个关键挑战。最近开源的Mem0项目为我们提供了一个强大的解决方案。

飞书

Character.ai 的愿景是“让地球上的每个人都能获得自己的深度个性化超级智能，帮助他们过上最美好的生活”。这意味着每个人都可以拥有像钢铁侠中的 Javis 一样的人工智能助手，能够帮助他们完成各种任务，成为他们生活中不可或缺的一部分。这种技术的发展将会为人类带来更多的便利和创新，改变人们的生活方式和工作方式。授课教师可以是 AI，游戏玩家也可以是 AI，情感伴侣可以是

飞书

在Character AI中，我们可以通过设置情感触发机制来实现这一点。例如，当提到与荣誉相关的话题时，骑士角色应该表现出兴奋和自豪的情感；当面临敌人的威胁时，他应该表现出愤怒和勇敢的情感。这些情感反应能够让角色更加真实和生动，让用户更容易沉浸在与角色的交互中。此外，角色的知识储备和价值观也会影响其个性。一个博学多才的角色可能会在交流中展现出丰富的知识和深刻的见解，而一个具有特定价值观的角色会根据自己的价值观来判断...

搜狐网

根据Character.AI的最新公告，预计将于明年第一季度推出的新功能旨在为18岁以下用户提供一个更加安全的互动环境。为了应对最近的两起诉讼案件，这些案件指控未成年人因与聊天机器人互动而导致自残或自杀风险，Character.AI表示，他们已经开发出两个不同版本的大型语言模型（LLM）—一个面向成人，一个面向青少年。青少年LLM的特点在于，在涉及敏感和浪漫内容时，其响应方式将得到更严格的限制。这种措...

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cDovL3MyLnppbWdzLmNuL2ltcz9hdD1zaXRlX2xvZ28ma3Q9dXJsJmtleT1hSFIwY0hNNkx5OW5hWEJ6TWk1aVlXbGtkUzVqYjIwdmFYUXZkVDAwTURNd016ZzFOakF5TERNNE56YzBNVEUyTmlabWJUMHpNRE13Sm1Gd2NEMHpNRE13Sm5OcGVtVTljakVzTVNaeFBURXdNQ1p1UFRBbVp6MHhiaVptUFVwUVJVY21abTEwUFdGMWRHOG1iV0Y0YjNKcGJHVnVNbWhsYVdNOU1qQXdNREF3TUQ5elBUYzNSRGM0T0RjMk9EWXhRemhGTXpJMU9EUTNNa0pGUkRBek1EQkZNRE5GJnNpZ249eXg6QW5jUUF6a01BbHZYNlVkbkZfVzAyc29FbTZRPSZ0dj0wXzAmcD0=&sign=yx:fA0vEOgPyPh7QErfYwyglvJjTR8=&tv=400_400

View all 16 sources

我需要继续深入了解大模型Agent记忆机制的技术实现方案，特别是关于MetaGPT这个框架。

MetaGPT Agent记忆机制实现方式技术架构

阿里云开发者社区

例如这篇文章中的代码：【AI Agent系列】【MetaGPT多智能体学习】3.开发一个简单的多智能体系统，兼看MetaGPT多智能体运行机制 get_memories 函数就是用来获取记忆的。你可以通过前面MetaGPT系列文章中的任一个Demo代码去体验这个函数的使用。2.再深入看源码 2.1 Memory模块总览下图是 MetaGPT 中 Memory 部分的代码文件： me...

知乎

MetaGPT的设计分为两个层次：基础组件层和协作层。基础组件层以AI Agent为核心，提供了观察、思考等能力。其建立了个体智能体操作和在系统范围内进行信息交换所需的核心模 ...

飞书

MetaGPT ：一种多代理框架，它通过将包含现实世界专业知识的SOP 编码到LLM 代理中来扩展复杂问题的解决能力，实验表明，与现有方法相比，它可以生成更一致、更全面的解决方案。

知乎

不需要cover所有的历史信息，而单智能体，比如AutoGPT，是需要记住所有的历史信息，意味着单智能体在面临长历史的复杂任务时，对记忆容量（大模型支持的序列长度）要求比较高。多 ...

CSDN技术社区

MetaGPT是一个基于大模型的meta-programing多智能体框架。Agent in SOPs 对于一个比较复杂的工程任务（例如让大模型写一个flappy bird游戏），需要通过扮演不同角色的大模型之间相互协同来完成这个庞大的任务。每个角色的大模型完成具体的一个子环节的工作，例如如下图所示： In MetaGPT,we specify the agent’s profile,which in...

阿里云开发者社区

经过上面的学习，我想你已经对 MetaGPT 的框架有了基本了解，现在我希望你能够自己编写这样一个 agent 这个 Agent 拥有三个动作打印1 打印2 打印3（初始化时 init_action([print,print,print])）重写有关方法（请不要使用act_by_order，我希望你能独立实现）使得 Agent 顺序执行上面三个动作当上述三个动作执行完毕后，为 <...

搜狐网

成熟的Agent框架可降低开发成本，MetaGPT和AutoGen是当前最流行的两个框架。MetaGPT通过为GPT模型分配不同角色来模拟协作的软件公司结构，以处理复杂任务；AutoGen作为开源框架，专注于通过多智能体对话和增强的LLM推理开发大型语言模型应用。MetaGPT与AutoGen对比 MetaGPT和AutoGen各有特点，MetaGPT

阿里云开发者社区

AI Agent【项目实战】：MetaGPT遇上元编程，重塑复杂多智能体协作的边界 MetaGPT 以一条需求作为输入，并输出用户故事/竞争分析/需求/数据结构/API/文档等。内部而言，MetaGPT 包含产品经理/架构师/项目经理/工程师等角色。它为软件公司提供了整个流程，并精心制定了标准化操作流程（SOP）。“代码=SOP（团队）”是核心理念。我们将SOP转化为代码，并将其应用于由LLM（大型语言模型）组成的团队...

View all 16 sources

现在我需要深入了解Character.ai的记忆机制实现方式，以补充我的研究。

Character.ai 记忆机制实现方式技术架构详细

文件

[PDF] Machine Theory of Mind

文件

[PDF] Learning Random Numbers to Realize Appendable Memory System for Artificial Intelligence to Acquire New Knowledge after Deployment

51cto.com

Character AI运作原理. Character AI构建于大型神经语言模型之上，其底层技术原理与ChatGPT、Gemini等背后的模型类似，均采用深度学习技术生成类人化文本。

aws.amazon.com

本文将聚焦于此，旨在为用户提供更自然、流畅的体验，并提高AI 角色在上下文记录、短期记忆和长期记忆等方面的对话管理能力。首先，我们将探讨展开 ...

飞书

本篇文章是对Noam Shazeer 一系列深度访谈的编译总结。相较于应用，Noam 更愿意将Character.AI 定义为一家通用模型公司，在Noam 看来，幻觉（hallucinations）是模型需要解决的 ...

知乎

稍微调研了一下 LangMem、MemOS、Mem0 这几个方案，做一个笔记总结。一、LangMem LangMem 是 LangGraph 生态的记忆管理库，设计比较简单、扁平，如果你的应用已经用了

51CTO

是否觉得和 AI 助手聊天就像在重复昨天的故事？你刚和它分享了重要的事情，转眼间它就忘得一干二净。很长一段时间里，这几乎是所有 AI 助手的通病—它们虽然聪明绝顶，但记忆却像金鱼一样短暂。不过，这种局面正在被打破。如今，AI 助手不仅能记住上周的对话，还能想起你的喜好，并且会从长期的互动中不断学习。这正是当下 AI 领域最前沿的研究方向之一，也是我今天想要重点探讨的话题：AI 智能体记忆

SegmentFault 思否

记忆机制是多智能体系统架构中的核心组成部分，它从根本上改变了我们设计和构建智能体系统的方式。一个典型的技术挑战是上下文窗口的限制。当达到上下文窗口.

View all 18 sources

已掌握的信息

核心概念与架构: Agent的记忆机制是其实现持续学习、个性化和处理复杂任务的关键。当前主流的技术架构是借鉴人类认知科学的混合式/分层式记忆系统，该系统明确区分短期记忆和长期记忆。短期记忆通过上下文窗口或内存缓冲区实现，用于维持即时对话的连贯性；长期记忆则依赖外部存储，以实现信息的持久化和跨会话检索。
技术实现方案: 长期记忆的主流实现方式是向量数据库（如FAISS, Milvus），它通过嵌入（Embedding）技术支持高效的语义检索。然而，单一的向量数据库不足以应对所有场景，因此先进的架构会融合知识图谱（存储结构化关系）、传统数据库（SQL/NoSQL）以及缓存系统（如Redis）来处理不同类型的记忆（如情节记忆、程序性记忆）。记忆的压缩（如LLM摘要）、检索和遗忘是管理记忆生命周期的关键操作。
典型应用案例分析:
- Character.ai: 其记忆系统服务于个性化和情感连接。通过记住用户的偏好和历史对话，塑造具有长期一致性的、可信的虚拟角色，从而提升用户粘性。其具体技术实现是专有的，但核心目标是服务于“角色扮演”和“建立关系”。
- MetaGPT: 其记忆机制的独特之处在于结构化的工作流记忆。它不依赖于传统的对话历史，而是通过让不同角色的Agent遵循标准作业程序（SOP），生成和共享结构化的文档（如需求文档、设计稿）作为记忆载体。这是一种面向任务和协作的共享工作空间记忆。
- OpenDevin: 作为一个AI软件工程师，其记忆系统必须能够管理整个开发环境的动态状态。这包括文件系统、代码变更、终端输出、浏览器状态以及宏观的任务规划。其核心是“事件流”（Event Stream），它按时间顺序记录了所有的动作和观察，构成了Agent对任务状态的完整记忆。
新兴框架与研究方向: 已经涌现出如MemGPT、MemoryOS等专门的记忆管理框架，它们提供了更精细化的分层和管理能力。当前的研究热点包括更智能的记忆更新与遗忘机制、多模态记忆的融合以及记忆如何驱动Agent的自我进化。

下一步行动计划

深化对OpenDevin记忆机制的探究: 进一步分析OpenDevin的技术实现，特别是其“事件流”如何被有效组织、压缩和检索，以支持长时间、复杂的软件开发任务。重点研究其如何在有限的上下文中维持对整个代码库和任务进度的“感知”。信息来源可参考其官方技术报告、GitHub仓库的架构文档以及相关的技术博客分析。
拓展应用案例的广度与深度: 调研除Character.ai、MetaGPT和OpenDevin之外的其他典型Agent应用，例如个人助理（如Adept）、企业自动化平台或游戏NPC（如网易《逆水寒》中的AI），分析它们在不同场景下的记忆系统设计哲学和技术选型，形成一个多维度的对比分析。信息来源可参考相关产品的官方博客、技术文档以及TechCrunch、VentureBeat等科技媒体的深度报道。
系统性梳理前沿学术研究: 聚焦于近两年AI顶级会议（如NeurIPS, ICML, ICLR）及预印本平台（arXiv）上的最新论文，系统性地归纳在以下几个前沿方向上的突破：
- 记忆的遗忘与巩固机制: 探索模拟人类“艾宾浩斯遗忘曲线”或睡眠巩固等机制的算法，使Agent能智能地判断哪些记忆应该被遗忘、哪些应该被强化。
- 多模态与具身记忆: 研究Agent如何整合和利用来自视觉、听觉等非文本模态的记忆，特别是在机器人或具身智能场景下。
- 记忆与反思（Reflection）: 深入理解Agent如何通过对过去记忆的反思来优化未来的规划和行动，实现真正的自我进化。
构建综合知识框架并进行可视化呈现: 整合所有调研信息，构建一个从“理论基础-技术实现-应用案例-前沿挑战”的完整知识框架。计划利用可视化图表，清晰地展示不同记忆架构的对比（例如，MetaGPT的结构化记忆 vs. Character.ai的对话记忆）、混合记忆系统的通用架构图，以及关键技术（如RAG、Memory-of-Thought）的演进脉络。
撰写最终研究报告: 基于上述框架，撰写一份结构清晰、图文并茂的深度研究报告。报告将系统性地阐述大模型Agent记忆的现状、核心技术、关键应用，并对未来的发展趋势和挑战进行展望。

OpenDevin Agent 记忆机制事件流 Event Stream 技术实现

知乎

1、搭架子选积木类似OpenDevin、OpenHands、Manus等均是通用Agent型应用，不论是否是通用Agent应用，均可以选择组合使用下面介绍的App Layer和基础组件进行Agent应用的实现。

github.com

欢迎来到llm-paper-daily! 这是一个获取最新研究论文的每日更新和分类的平台。希望为爱好者提供LLM 研究的前沿资讯，让您更轻松地了解该领域的最新发展。

阿里云开发者社区

OpenDevin是一个社区驱动的平台，它提供了一种机制，使得用户界面、代理和环境能够通过事件流架构进行交互。这个平台包括一个由沙盒操作系统和网络浏览器组成的环境，代理可以通过这个环境执行任务。此外，OpenDevin还提供了一个接口，允许代理以类似于实际软件工程师的方式与环境进行交互，包括创建复杂的软件、执行代码和浏览网站以收集信息。OpenDevin还支持多代理协作，允许多个专门的代理协同工作来解决任务。此外，该平...

51CTO

状态与事件流。在OpenDevin中，状态是一种数据结构，封装了agent 执行所需的所有相关信息。该状态的一个关键组成部分是事件流，它是一个按时间顺序排列的过去动作和观察结果的集合，包括agent 自身的动作和用户交互（例如，指令、反馈）。然而，状态不仅仅局限于事件流。图1：OpenDevin 用户界面（UI，SD）允许用户查看文件、检查执行的bash命令/Python代码、观察<...

知乎

最近看了一张画Agent记忆分类的图我觉得分类分的还可以，但是太浅了，于是就着它的逻辑，仔细得写了一下在不同的记忆层，该如何设计和选型先从流程，作用，实力和持续时间的这4个维度来解释一下这几

CSDN技术社区

python 流式 event stream Python中实现流式事件流处理 Faust库简介对于希望在Python环境中进行高效流处理的开发者来说，Faust是一个非常合适的选择。该库把Kafka Streams的概念引入到Python编程语言之中，不仅提供了强大的流处理能力，还允许集成多种流行的科学计算和数据分析工具，如NumPy、Pandas以及机器学习框架PyTorch等[^1]。import faust app=faust...

阿里云开发者社区

是不是event-streaming这种事件流的推送模式,哪怕关了批量推送,他推过来的也是一个数组结构是的，Event Streaming 推送的数据通常是一个数组结构，即便是在关闭批量推送的情况下。这是因为事件流的本质就是将连续的事件推送给订阅者，为了方便处理，通常会将这些事件组织为一个数组（也称为 batch）进行推送。在关闭批量推送的情况下，Event Streaming 也...

阿里云帮助中心

启用一个已创建或已停用的事件流。启用一个已创建或已停用的事件流。接口说明启用一个已创建或已停用的事件流。调试您可以在 OpenAPI Explorer 中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer 可以自动生成 SDK 代码示例。调试授权信息下表是 API 对应的授权信息，可以在 RAM 权限策略语句的 Action 元素中使用，用来给 RAM 用户或 RAM 角色授予调用此 API 的权限。具体说明如下：...

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIzMTEwNzE2MjUyNi1tYnF0anhlZG9hZHdlbTF1bjh2aXUyZmJqOWdiaDV4aS5qcGc=&sign=yx:yQchh3-fC9nPjUvoM67lCnyns5g=&tv=400_400

View all 10 sources

我需要继续深入研究Agent记忆系统的实现方式，特别是关注Adept AI的实现。

Adept AI Agent 记忆机制实现方式技术架构

文件

[PDF] Learning Random Numbers to Realize Appendable Memory System for Artificial Intelligence to Acquire New Knowledge after Deployment

知乎

为了让AI Agent真正理解上下文、具备个性化交互和任务持续性，引入记忆系统至关重要。本文将从技术与架构角度出发，系统介绍构建短期和长期记忆的最佳实践。

知乎

本文将结合相关论文，深入解析Second Me的设计理念、核心架构、训练方法及其作为Agent记忆系统参考范式的意义。现有AI记忆方案的局限性. 在探讨Second Me ...

飞书

基于浏览器的AutoGPT 实现，可通过无代码平台访问。 ... 一个让智能体协同工作的平台，其类似于AutoGPT 和Baby AGI，但用TypeScript 编写。 ... 一项旨在使GPT-4 完全自动化的实验 ...

SegmentFault 思否

在上一篇文章中，我们搭建了 AI Agent 的基础框架。今天，我想深入讲讲 AI Agent 最核心的部分之一：记忆系统。说实话，我在实现记忆系统时走了不少弯路，希.

m.betteryeah.com

一、AI Agent核心技术架构与工作原理 1.1 智能体四大核心模块解析 AI Agent的核心能力源于其独特的架构设计，通常包含以下模块：感知系统：通过API、传感器或第三方工具实时获取环境数据（如创新奇智平台支持对接工业物联网设备）记忆存储：基于向量数据库实现上下文记忆（Monica.im的Manus产品可记录用户交互习惯）决策引擎：结合大模型推理与规则引擎生成行动计划（通义...

知乎

oracle.com

AI agent 结合上文提到的技巧和技术来实现所分配的目标。例如，推荐 agent 可以使用机器学习，利用大量数据集来识别模式；通过自然语言处理来理解请求并与用户通信；以及通过企业工具（例如 ERP 系统、数据库或物联网传感器）或外部数据源（包括互联网）的接口来收集信息。AI agent 扮演着规划者的角色。这些 agent 可以根据所分配的目标，识别出所需的任务和步骤。以我们的客户服务 agent...

View all 17 sources

我需要继续研究OpenDevin的事件流架构，这是我之前搜索结果中提到但没有详细解释的内容。

OpenDevin 事件流架构 Event Stream Architecture 技术实现详细

tianqi.csdn.net

1.介绍 · 一种交互机制，允许用户界面、Agent和环境通过强大而灵活的事件流架构进行交互（§2.1）。 · 一种由沙盒操作系统和Web 浏览器组成的环境，Agent可以利用它来完成其 ...

虎嗅网

这三块之间其实是纯粹的Agent和event stream的交互逻辑。用户交互是通过直接往event stream里加入信息来实现的。比如用户想让Agent做某件事，就直接把 ...

知乎

流式输出与事件监听：大部分适配模型支持流式输出，可通过事件监听 ... 其技术原理包括：模块化架构: 框架设计支持集成不同的组件，如各种工具 ...

百度百科

《面向SOA的事件驱动架构设计与实现》是2013年01月出版的图书，作者是Hugh Taylor。中文名面向SOA的事件驱动架构设计与实现作者 (美)Hugh Taylor出版时间2013年01

极客邦

如果使用事件架构（Event Architecture）并将所有事件持久化为数据流，那么就我们可以转回到单一数据源上。这是 Ben Stopford 在他撰写的博客文章中提出的，此篇博客是他关于如何在 Kafka 中使用事件的系列博文之一。Stopford 是 Confluent 公司的一名工程师他在博文中指出，传统的消息系统中，事件是短暂存在的，已消费的事件并没有历史信息。持久...

博客园

Event flow(事件流) 流：流的概念，在现今的JavaScript中随处可见。比如说React中的单向数据流，Node中的流，又或是今天本文所讲的DOM事件流。都是流的一种生动体现。至于流的具体概念，我们采用下文的解释：用术语说流是对输入输出设备的抽象。以程序的角度说，流是具有方向的数据事件流之事件冒泡与事件捕获：在浏览器发展的过程中，开发团队遇到了一个问题。那就是页面中的哪一部分拥有...

微软公司

制造和流程控制、公用事业、金融贸易、Web 和 IT 监控等领域内的操作系统可以生成具有复杂相互关系和较短滞后时间要求的事件流。鉴于处理此类事件流所涉及的临时因素，这些系统中的一个主要难点是确定在多样的动态流行为下的结果的有效性，以及如何排除可能出现的故障。这种需要催生了查询分析工具，用来满足以下要求：处理大量数据，同时缩小问题搜索空间。处理严格的一致性要求。对用户足够直观，便于其快速得出诊断结果或解决方案。Microsoft StreamInsight 提供了独立的<...

博客园

例如，想象一下协调以下场景的复杂情况：在触发事件 C 之前，必须完成事件 A 和事件 B 的处理，并且在等待 Event C 完成之后，Event D 和 Event E 必须等待 Event C 开始处理之前启动。要成功应对这种混乱局面最好使用编排式服务导向架构或编排式微服务进行复杂协调。错误处理也是使团队远离事件驱动架构的复杂...

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTg0NDEyNDQ0LzgzLzdkLzI2LzgzN2QyNjBiZGI3ODg0NzQxYWNhMWMzZGQ5NWQwMTc2Lmljbw==&sign=yx:FgUrPkD016Rc89-ZBz7SYezxGYQ=&tv=400_400

View all 14 sources

我现在需要整合所有收集到的信息，深入了解OpenDevin的事件流架构。

OpenDevin architecture event stream github technical report

researchgate.net

In this paper, we introduce OpenDevin, a platform for the development of powerful and flexible AI agents that interact with the world in similar ways to those ...

知乎

2. EventStream. 定义Event的代码位于 opendevin/events 中，所有的事件类都继承下面两种事件类型：. Action：触发操作类型或接受用户指令; Observation：执行action后的 ...

github.com

Welcome to our list of AI agents. We structured the list into two parts: To filter the products by categories and use-cases, see the web version of this list.

新浪财经

目前，OpenDevin 的 GitHub 已经获得了超过 2.9 万 Star 量。近日，OpenaDevin 团队发布了该工具的技术报告。报告地址：https://arxiv.org/pdf/2407.16741 在技术报告中，OpenDevin 的作者，来自伊利诺伊大学香槟分校、卡耐基梅隆大学等机构的学者们详细介绍了 OpenDevin，这是一个社区驱动的平台，旨在开发通过软件与世界交互的通用和专业 AI Agent。更重要的是，OpenD...

www.archdaily.cn

Jessica Charlesworth 9.Peju Alatise(Lagos,Nigeria)10.Philip Beesley Architect and Living Architecture Systems Group(Toronto,Canada)Philip Beesley 11.Refik Anadol Studio(Los Angeles,USA)Refik Anadol 12.Studio Libertiny(Rotterdam,The Netherlands)Tom...

Journal of Computer Science and Technology (JCST)

Hwang K,Xu Z W.Scalable Parallel Computing:Technology,Architecture,Programming.McGraw-Hill,1998. [2] Brown T B,Mann B,Ryder N et al.Language models are few-shot learners.In Proc.the 34th Int.Conf.Neural Information Processing Systems,Dec.2020,pp.1...

腾讯云

[1]:https://github.com/stitionai/devika#table-of-contents [2]About:https://github.com/stitionai/devika#about [3]Key Features:https://github.com/stitionai/devika#key-features [4]System Architecture:https://github.com/stitionai/devika#system-arc...

博客园

[10]arXiv"Neural Architecture Search with Reinforcement Learning 1.7 Superior Generalizability and Interpretability [11]arXiv"Making Neural Programming Architectures Generalize via Recursion 1.8 Seq2seq RL GANs for Dialogue Generation [12]arXiv"Ad...

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9jZG4uc20uY24vdGVtcC8yMDIxMDkxNDE3MTUxNC0wdmVxY2ZwYTk2Nmh2c3p5OHRmcW96a3l6cHp0a2VxYy5KUEc=&sign=yx:kROpGG3jrz4QX9N1U0SMnACwTWg=&tv=400_400

View all 16 sources

已掌握的信息

核心架构与技术实现: Agent的记忆系统普遍采用借鉴人类认知的分层混合架构，区分短期记忆（通常通过上下文窗口或内存缓冲区实现，用于维持即时对话连贯性）和长期记忆（依赖外部存储，如向量数据库、知识图谱、传统SQL/NoSQL数据库）。长期记忆的核心技术是利用向量数据库（如FAISS, Milvus）进行高效的语义检索，并通过摘要压缩、相关性排序等方式管理记忆内容。
典型应用案例的记忆机制:
- Character.ai: 其记忆系统服务于个性化与情感连接。通过记录用户偏好和对话历史，塑造具有长期一致性的虚拟角色，核心在于提升用户粘性和角色扮演的沉浸感。
- MetaGPT: 采用独特的结构化工作流记忆。其记忆载体并非对话历史，而是由不同角色的Agent遵循标准作业程序（SOP）生成的结构化文档（如需求文档、设计图），这是一种面向任务协作的共享工作空间记忆。
- OpenDevin: 作为AI软件工程师，其记忆核心是事件流（Event Stream）。这是一个按时间顺序记录所有动作（如代码写入、命令执行）和观察（如终端输出、文件状态）的日志，构成了Agent对任务完整状态的全面记忆，是其进行规划和决策的基础。
研究现状与前沿方向: 已涌现出如MemGPT、MemoryOS等专门的记忆管理框架。当前的研究热点聚焦于更智能的记忆更新与遗忘机制（避免信息过载和“灾难性遗忘”）、多模态记忆的融合（整合文本、图像、声音等信息）以及记忆如何驱动Agent的反思与自我进化。

下一步行动计划

拓展应用案例的广度与深度: 调研除已分析案例之外的其他典型Agent应用，如个人助理（例如Adept AI）、企业自动化平台或游戏NPC（例如网易《逆水寒》中的AI）。重点分析它们在不同应用场景下的记忆系统设计哲学和技术选型，形成一个多维度的对比分析。信息来源可参考相关产品的官方博客、技术文档以及TechCrunch、VentureBeat等科技媒体的深度报道。
系统性梳理前沿学术研究: 聚焦近两年AI顶级会议（如NeurIPS, ICML, ICLR）及预印本平台（arXiv）的最新论文，系统性地归纳在以下几个前沿方向上的突破性进展：
- 记忆与反思（Reflection）及自我进化: 深入理解Agent如何通过对过去记忆的反思来优化未来的规划和行动，实现真正的自我进化。
- 记忆的遗忘与巩固机制: 探索模拟人类“艾宾浩斯遗忘曲线”或睡眠巩固等机制的算法，使Agent能智能地判断哪些记忆应该被遗忘、哪些应该被强化。
- 多模态与具身记忆: 研究Agent如何整合和利用来自视觉、听觉等非文本模态的记忆，特别是在机器人或具身智能场景下。
构建综合知识框架并进行可视化呈现: 整合所有调研信息，构建一个从“理论基础-技术实现-应用案例-前沿挑战”的完整知识框架。计划利用可视化图表，清晰地展示不同记忆架构的对比（例如，MetaGPT的结构化记忆 vs. Character.ai的对话记忆 vs. OpenDevin的事件流记忆）、混合记忆系统的通用架构图，以及关键技术（如RAG、Memory-of-Thought）的演进脉络。
撰写最终研究报告: 基于上述框架，撰写一份结构清晰、图文并茂的深度研究报告。报告将系统性地阐述大模型Agent记忆的现状、核心技术、关键应用，并对未来的发展趋势和挑战进行展望。

Adept AI Agent 记忆机制实现方式技术架构

文件

[PDF] Learning Random Numbers to Realize Appendable Memory System for Artificial Intelligence to Acquire New Knowledge after Deployment

知乎

飞书

SegmentFault 思否

m.betteryeah.com

知乎

oracle.com

View all 17 sources

我需要继续深入了解Adept AI的记忆机制实现方式，让我尝试搜索更具体的信息。

Adept AI ACT-1 记忆机制 Action Transformer 技术实现

知乎

他们这次放出的ACT-1，形态就是一个浏览器插件，输入文本指令，插件对任务拆解并执行。比如帮用户找房子：再比如帮用户在Salesforce上找数据，人工则需要点 ...

智源社区

ACT-1是一款能够代替人类使用常见软件的系统，用户只需要输入希望进行的操作或者想要搜索的问题，ACT-1就能帮助用户实现目的。经过训练的ACT-1可以使用软件 ...

腾讯云

Adept AI 推出了Action Transformer (ACT-1) 大模型，这是一种可以在数字世界中采取行动的大型模型。这种新模型经过训练可以使用现有的所有软件工具 ...

搜狐网

Action Transformer（ACT-1）。简单来说，这是一个会使用浏览器、Excel等软件工具的AI。基于Transformer的自然语言处理能力，它能理解人类给出的命令，并完成相应操作。比如，想要在Excel表格中加上利润、利润率，只需把这段话输入给AI，它就能自己在对应行列创建公式完成任务了。想要在网上找房子，也不用自己搜索再设置各种筛选条件了。只需要告诉AI：帮我在休...

36氪

据《福布斯》报道，Adept的第一个产品名为Action Transformer(ACT-1)，它是一个经过训练可以使用数字工具的大型Transformer模型。ACT-1可以帮助人们做很多事情。ACT-1可以接受人们提出的高级用户请求并执行它。用户只需在文本框中键入命令，其余的事情由 ACT-1 完成。它对于手...

php中文网

Adept AI 推出了 Action Transformer(ACT-1)大模型，这是一种可以在数字世界中采取行动的大型模型。这种新模型经过训练可以使用现有的所有软件工具、API 和 Web 应用程序，该公司认为，通用智能最清晰的框架是一个可以做人类在计算机前可以做的任何事情的系统。所以可以说GPT-3，GPT-4是你的个人助理，ACT-1可以说是AI为你打造的超级员工，进一步释放...

搜狐网

2022年9月14日，Adept团队推出了它们的第一个大模型Action Transformer(ACT-1)，它是专门设计和训练用于计算机上执行操作以响应自然语言命令的模型。ACT-1是迈向基础模型的第一步，该模型可以使用现有的所有软件工具、API 和网站。目前公司还没有相关产品发布。创始人:均为Google Brain前团队成员，成员包括Transformer架构提出者David...

知乎

论文地址： https:// arxiv.org/pdf/2412.0976 4 论文名称： Memory Layers at Scale u200b 本文提出了一种memory layer用于

View all 15 sources

我需要继续深入了解AI Agent的记忆机制，特别是关于记忆与反思的研究。

AI Agent 记忆与反思 Reflexion 自我进化研究进展

文件

[PDF] An In-depth Survey of Large Language Model-based Artificial Intelligence Agents

钛媒体

此外，随着自主 AI agent 的能力增强，部署更安全、可控的 agent 成为研究的重点。当前 agent 仍难准确区分必要敏感信息与无关信息，在目标涉及不当手段时，管理行为更为困难，学习的不确定性、语义模糊情境和记忆模块的设计缺陷均会加剧安全挑战。通过收集大规模、多元真实场景数据以支持安全行为学习，完善 agent 架构的规则和案例库，探索更安全的训练算法，调查隐私保护措施对 agent 效率的影响，才可能实现平衡且安全的部署。最...

知乎

最近的研究表明，配备反思和记忆增强能力的自进化智能体在增强泛化方面显示了巨大希望，特别是在较小的、资源受限的模型中。尽管如此，这些方法在处理 ...

知乎

这篇综述论文系统性地梳理了「自进化智能体」（Self-Evolving Agents）领域截止目前（2025 年7 月）的进展。当前，尽管大语言模型（LLM）能力强大，但它们 ...

bigai.ai

鉴于此，本文将多智能体自博弈（Self-play）和记忆增强的反思机制结合，并进一步引入到基于大语言模型的智能体架构中，构建出一种能够自主进化的智能体框架。该 ...

搜狐网

前面的文章中，作者分享了一种偏重反思的AI Agent设计模式，即Basic Reflection。但面对复杂度很高的产品时，还有另一种框架可以解决。就是本文介绍的Reflexion设计模式。在文章《》中，风叔结合原理和具体源代码，详细介绍了第一种偏重反思的AI Agent设计模式，即Basic Reflection。Basic Reflection 的思路非常朴素，就是通过左右互搏...

CSDN技术社区

而Reflection（反思）模式，正是为了解决这一问题而应运而生的一种AI Agent设计模式。一、Reflection模式的定义与工作原理 Reflection模式，顾名思义，就是让AI对自己的输出进行反思和改进的过程。它类似于人类在写作、编程或其他创作活动中，完成初稿后进行自我审查和修改的过程。具体来说，AI首先针对任务生成一个初始输出，然后对这个输出进行审视，检查其准确性、完整性和逻辑性，识别...

ITPUB博客

反思（Reflection），是一种重要的AI Agent工作范式。由于我们不再满足于生成式AI单次响应的能力，而是期望它能像人类一样反思和不断改进，生成更加精准和可靠的结果，这对于扩大生成式AI在高要求生产环境下的应用非常关键。基本的反思模式通过简单的生成和自我反馈循环，不断优化输出：但这种基础反思模式仅限于内部逻辑与规则的反思及优化，就像考试...

View all 16 sources

我需要继续深入了解AI Agent的记忆机制，特别是关于记忆与反思的研究。

Reflexion AI Agent 记忆机制论文实现方式代码

文件

[PDF] An In-depth Survey of Large Language Model-based Artificial Intelligence Agents

知乎

我们的目标是创建AI agent，通过反思失败并增强其结果来学习，就像人类一样。在这篇文章中，我们描述了我们正在探索的与扩展Reflexion 框架相关的一些想法， ...

知乎

记忆: 包含了短期记忆和长期记忆两部分。短期记忆与上下文学习有关，属于提示工程的一部分，而长期记忆涉及信息的长时间保留和检索，通常是通过利用外部向量存储和快速检索 ...

promptingguide.ai

总的来说，自我反思的关键步骤是a)定义任务，b)生成轨迹，c)评估，d)执行自我反思，e)生成下一条轨迹。下图展示了自我反思的智能体学习迭代优化其行为来解决 ...

搜狐网

在文章《》中，风叔结合原理和具体源代码，详细介绍了第一种偏重反思的AI Agent设计模式，即Basic Reflection。Basic Reflection 的思路非常朴素，就是通过左右互搏让两个Agent相互进化，实现成本也较低。但是在实际应用中，Basic Reflection的Generator生成的结果可能会过于发散，和我们要求的结果相去甚远。同时，当面对一些复杂度很高的问题时，Basic Reflection框架也难以解决...

SegmentFault 思否

知乎

## 要点 - 借鉴人类认知过程，LLM 可以被训练选择性地从长文档中抽象和保留相关信息。 - LLM 内部的记忆管理任务（决定保留或丢弃哪些信息）可以被有效地表述并作为强化学习问题进行优化。 -

新浪

这也就是AI Agent的概念，通过对环境的感知，完成不同的子任务，从而来实现更复杂的目标。系统2通过语言推理、记忆调用、自我思考和规划，将复杂问题拆解成由系统1组成的流程单元，分别执行不同的任务从而达到目的。并在多次实践和运用中沉淀为“经验”数据提供给系统1去训练，从而让系统1获得新的能力。图源来自：澜码科技总的来说，系统 1 和系统 2 共同作用，影响着我们的思考、判断和决策过程。那么，如何让每个智能体都拥有系统2的能力，使其能够调用长期记...

https://s2.zimgs.cn/ims?kt=url&at=smstruct&key=aHR0cHM6Ly9ndy5hbGljZG4uY29tL0wxLzcyMy8xNTg0NDI0NTIyL2U2LzZjL2VhL2U2NmNlYTU0YTEwZDEzMzZjODhiNGMwMjkxMTRhOThjLmljbw==&sign=yx:72z_oIinDw9pBPBAn9IuCIeCKNA=&tv=400_400

View all 16 sources

已掌握的信息

核心架构与技术实现: Agent的记忆系统普遍采用借鉴人类认知的分层混合架构，该架构明确区分短期记忆（通过上下文窗口或内存缓冲区实现，用于维持即时对话）和长期记忆（依赖外部存储，如向量数据库、知识图谱、传统SQL/NoSQL数据库）。长期记忆的核心技术是利用向量数据库（如FAISS, Milvus）进行高效的语义检索，并通过摘要压缩、相关性排序等方式管理记忆内容。
应用案例中的记忆机制: 不同类型的Agent根据其核心任务，演化出了不同的记忆机制。
- 情感/角色扮演型 (如Character.ai): 记忆系统服务于个性化与情感连接，通过记录用户偏好和对话历史，塑造具有长期一致性的虚拟角色。
- 协作任务型 (如MetaGPT): 采用结构化工作流记忆，记忆的载体是标准作业程序（SOP）和过程中生成的结构化文档（如需求文档、设计图），而非传统的对话历史。
- 软件开发型 (如OpenDevin, Adept AI): 记忆系统需要捕捉动态的环境状态。OpenDevin的**事件流（Event Stream）按时序记录所有动作和观察，构成了对任务状态的完整记忆。Adept AI的Action Transformer (ACT-1)**则通过观察GUI并执行点击、输入等操作，其记忆必然包含了对UI元素和操作序列的理解。
记忆与自我进化: 记忆不仅是信息的被动存储，更是Agent实现自我进化的主动力。Reflexion框架是其中的典型代表，它通过让Agent对失败的行动轨迹进行自我反思，并将这些反思（语言形式的反馈）存入记忆，从而在后续尝试中指导其做出更优的决策，实现了在不更新模型参数的情况下从经验中学习。

下一步行动计划

系统性梳理前沿学术研究: 聚焦近两年AI顶级会议（如NeurIPS, ICML, ICLR）及预印本平台（arXiv）的最新论文，系统性地归纳在以下几个前沿方向上的突破性进展：
- 记忆与反思（Reflection）及自我进化: 深入理解Agent如何通过对过去记忆的反思来优化未来的规划和行动，实现真正的自我进化。
- 记忆的遗忘与巩固机制: 探索模拟人类“艾宾浩斯遗忘曲线”或睡眠巩固等机制的算法，使Agent能智能地判断哪些记忆应该被遗忘、哪些应该被强化。
- 多模态与具身记忆: 研究Agent如何整合和利用来自视觉、听觉等非文本模态的记忆，特别是在机器人或具身智能场景下。
构建综合知识框架并进行可视化呈现: 整合所有调研信息，构建一个从“理论基础-技术实现-应用案例-前沿挑战”的完整知识框架。计划利用可视化图表，清晰地展示不同记忆架构的对比（例如，MetaGPT的结构化记忆 vs. Character.ai的对话记忆 vs. OpenDevin的事件流记忆）、混合记忆系统的通用架构图，以及关键技术（如Reflexion、Memory-of-Thought）的演进脉络。
撰写最终研究报告: 基于上述框架，撰写一份结构清晰、图文并茂的深度研究报告。报告将系统性地阐述大模型Agent记忆的现状、核心技术、关键应用，并对未来的发展趋势和挑战进行展望。

可视化工具

现在我需要继续深入研究AI Agent的记忆与反思机制，特别是Reflexion框架的具体实现方式。

可视化工具

我需要进一步研究Reflexion框架在不同应用场景中的具体实现和效果。

可视化工具

我需要进一步研究AI Agent记忆机制的技术实现和应用案例。

AI Agent 记忆机制实现方式 MemGPT MemoryOS 代码实现

cnblogs.com

以下是一个在智能体中使用Memory的示例，短期记忆默认使用Memory初始化，直接传入Agent的运行过程中，Agent每一步运行都会调用finalize方法来更新Memory。

51cto.com

... 记忆演化机制”：它不是把记忆模块当外挂工具，而是将记忆深度整合进整个交互流程，真正实现“AI代理记忆架构的内生化”。实验验证也不负众望，在面向超 ...

cnblogs.com

本文将从其架构组成、核心模块、运行机制与工程集成路径进行深度解析，展示其在对话型AI 系统、Agent 长期行为建模、AI 客服与多轮记忆对话中的真实落地 ...

稀土掘金

from mem0.proxy.main import Mem0 client=Mem0(api_key="m0-xxx")#First interaction:Storing user preferences messages=[{"role":"user","content":"I love indian food but I cannot eat pizza since allergic to cheese."},]user_id="alice"c...

微博

AI Agent Memory 指 AI 代理系统能够存储与检索过去交互经验，用以提升决策能力、语境连贯性与个性化响应能力。它可分为两大类： 1.短期记忆（Working Memory/Short-Term Memory）：用于保存当前对话或任务中的上下文信息，如用户当前询问、系统指令、工具定义等。2.长期记忆（Persistent/Long-Term Memory）：跨多次会话保存...

知乎

大语言模型受限于固定上下文窗口，长期对话中 “ 失忆 ”、记忆断裂等问题频发，北邮百家AI团队重磅推出首个大模型记忆操作系统开源框架MemoryOS。巧妙融合计算机操作系统原理与人脑分层记忆机制，

澎湃新闻

来自上海交通大学和浙江大学等知名院校的研究团队开发了他们称之为人工智能领域首个"内存操作系统"的系统，解决了一个阻碍AI系统实现类人持久记忆和学习能力的根本性限制。这个名为MemOS的系统将内存视

稀土掘金

const agent=new Agent({ name:"MyMemoryAgent",instructions:"You are a helpful assistant with memory.",model:openai("gpt-4o"),memory });4.2 会话交互在调用代理的 stream()或 generate()方法时，必须提供 resourceId 和 threadId 以...

View all 17 sources

已掌握的信息

核心架构与技术实现: Agent的记忆系统普遍采用借鉴人类认知的分层混合架构，该架构明确区分短期记忆（通过上下文窗口或内存缓冲区实现）和长期记忆（依赖外部存储）。长期记忆的主流实现方式是向量数据库，并常与知识图谱、传统数据库等结合。新兴的专用记忆框架，如MemGPT和MemoryOS，提供了更系统化的解决方案，例如MemoryOS借鉴操作系统原理，构建了包含存储、更新、检索、生成四大模块的三级分层记忆体系。
应用案例中的记忆机制: 不同类型的Agent根据其核心任务，演化出了不同的记忆机制。
- 情感/角色扮演型 (如Character.ai): 记忆系统服务于个性化与情感连接，通过记录用户偏好和对话历史，塑造具有长期一致性的虚拟角色。
- 协作任务型 (如MetaGPT): 采用结构化工作流记忆，记忆的载体是标准作业程序（SOP）和过程中生成的结构化文档，而非传统的对话历史。
- 软件开发/操作型 (如OpenDevin, Adept AI): 记忆系统需要捕捉动态的环境状态。OpenDevin的**事件流（Event Stream）按时序记录所有动作和观察；Adept AI的Action Transformer (ACT-1)**则通过观察GUI并执行点击、输入等操作，其记忆包含了对UI元素和操作序列的理解。
记忆与自我进化: 记忆不仅是信息的被动存储，更是Agent实现自我进化的主动力。Reflexion框架是其中的典型代表，它通过让Agent对失败的行动轨迹进行自我反思，并将这些反思（语言形式的反馈）存入长期记忆，从而在后续尝试中指导其做出更优的决策，实现了在不更新模型参数的情况下从经验中学习。

下一步行动计划

构建全面的对比分析框架: 系统性地整合已调研的应用案例（如Character.ai, MetaGPT, OpenDevin, Adept AI）和技术框架（如Reflexion, MemGPT, MemoryOS），从多个维度进行对比分析。维度应包括：记忆类型（情节、语义、程序性等）、技术实现（向量数据库、事件流、结构化文档等）、核心应用目标（个性化、任务协作、状态维持等）以及自我进化机制（如是否包含反思环节）。此分析旨在揭示不同记忆架构的适用场景与设计哲学。
系统梳理前沿学术研究: 聚焦近两年AI顶级会议（如NeurIPS, ICML, ICLR）及预印本平台（arXiv）的最新论文，系统性地归纳在以下几个前沿方向上的突破性进展：
- 记忆的遗忘与巩固机制: 探索模拟人类“艾宾浩斯遗忘曲线”或睡眠巩固等机制的算法，使Agent能智能地判断哪些记忆应该被遗忘、哪些应该被强化。
- 多模态与具身记忆: 研究Agent如何整合和利用来自视觉、听觉等非文本模态的记忆，特别是在机器人或具身智能场景下。
设计并撰写最终研究报告: 基于上述分析和研究，设计一份结构清晰、逻辑严密的深度研究报告。报告的核心章节应包括：
- 引言: 概述Agent记忆的重要性及研究背景。
- 核心概念与分层架构: 详细阐述不同记忆类型的定义与功能，并展示分层混合记忆的通用架构图。
- 技术实现深度解析: 剖析主流的记忆技术栈，并对比不同技术方案的优劣。
- 典型应用案例对比分析: 深入分析不同应用场景下的记忆系统设计，并以可视化图表形式呈现对比结果。
- 前沿机制：记忆与自我进化: 重点阐述以Reflexion为代表的反思机制如何驱动Agent学习与进化。
- 未来展望与挑战: 总结最新的学术研究成果，并探讨在记忆压缩、多模态融合、安全与隐私等方面面临的挑战与发展趋势。

可视化工具

我需要进一步研究不同应用场景下的AI Agent记忆机制实现。

可视化工具

现在我需要整合所有收集到的信息，为用户提供一份全面的研究报告。

大模型基于Agent记忆的调研报告

一、引言：Agent记忆的重要性与研究背景

在大模型技术快速发展的今天，AI Agent作为一种能够自主感知环境、进行决策并执行动作的智能体，正在成为人工智能领域的重要研究方向。然而，传统大语言模型(LLM)受限于固定上下文窗口，往往只能记住"最近"的内容，一旦对话变长、话题中断，甚至是换了会话窗口，先前的信息便如断线的风筝悄然飘走51cto.com。这种"断裂记忆"的问题，不仅影响对话连贯性，更让个性化推荐、长期交互甚至情绪共鸣变得困难51cto.com。

记忆机制是AI Agent实现持续学习、个性化和处理复杂任务的关键知乎。它使Agent能够像人类一样，通过积累经验、记忆历史交互来不断优化自身的决策和行为。本报告将深入探讨大模型Agent记忆机制的核心概念、技术实现、典型应用案例以及前沿研究方向，为构建具有持久记忆能力的智能Agent提供系统性的认知框架。

二、核心概念与分层架构

2.1 记忆类型与分类

AI Agent的记忆系统借鉴了人类认知科学的研究成果，主要分为以下几类：

短期记忆（Short-Term Memory）：
- 主要通过上下文窗口或滚动缓存维持
- 适用于保持当前会话连贯性
- 依赖于LLM的token限制，不能存储跨会话知识知乎
长期记忆（Long-Term Memory）：
- 可持久化存储知识、用户偏好、交互事件等
- 进一步细分为三类：
  - 语义记忆：结构化知识
  - 情节记忆：用户行为记录
  - 程序性记忆：执行流程和策略知乎

这种记忆帮助代理"记住你是谁"，支持更复杂的个性化和任务处理知乎。

2.2 分层混合记忆架构

为了应对记忆管理的挑战，研究者们提出了分层混合记忆架构。这种架构将记忆系统组织为多个层次，每个层次负责不同类型和时效性的记忆管理。

资料来源：知乎知乎 SegmentFault 思否知乎 promptingguide.ai

上图展示了大模型Agent记忆机制的分层架构，包括短期记忆、长期记忆和记忆管理机制三大部分。短期记忆主要通过上下文窗口和工作记忆缓冲区实现；长期记忆则分为语义记忆、情节记忆和程序性记忆，分别通过不同的技术手段实现；记忆管理机制包括记忆压缩、检索、遗忘和反思四个关键环节，共同构成了完整的记忆生命周期管理。

三、技术实现深度解析

3.1 主流技术实现方案对比

当前，大模型Agent记忆机制的技术实现已经从理论探讨走向了工程实践，出现了如LangChain、LlamaIndex等提供记忆模块的开发框架知乎。以下是几种主流技术实现方案的对比：

技术方案	核心架构	记忆类型	存储介质	记忆管理机制	适用场景	优势	局限性
MemGPT	多级内存结构（主要上下文+外部上下文）	短期记忆、长期记忆	内存缓存+向量数据库	函数调用在主要上下文和外部上下文间传递数据	长对话助手、个性化交互	能处理超长对话历史，支持跨会话记忆	计算成本较高，需要频繁LLM调用
MemoryOS	三级分层记忆（短期、中期、长期）+四大核心模块（存储、更新、检索、生成）	短期记忆、中期记忆、长期记忆	段页式三级存储架构	热度驱动的动态更新机制+语义感知的多级检索算法	长对话助手、个性化交互、多轮复杂任务	在LoCoMo基准上F1和BLEU-1分数平均提升49.11%和46.18%，计算效率高	系统复杂度较高，部署要求高
Reflexion	Actor-Evaluator-Self-Reflection三模块架构	短期记忆（轨迹）、长期记忆（反思经验）	内存缓存+外部存储	通过语言反馈强化学习，将反思结果存入记忆	决策任务、推理任务、编程任务	在HumanEval上性能提升21%，在LeetCode Hard上提升32%	反思质量依赖于评估机制，可能陷入错误循环
Mem0	轻量级、可扩展的长期记忆框架	短期记忆、长期记忆	向量数据库+图数据库（混合存储）	自动从对话中提取关键信息，持续更新并消除矛盾	个性化助手、多轮对话	双重存储架构结合向量数据库和图数据库，智能检索系统	API集成便捷但功能相对基础
LlamaIndex记忆模块	短期记忆+长期记忆	短期记忆、长期记忆	基于SQLAlchemy的内存存储+向量数据库	短期记忆超限时持久化存储或通过事实抽取压缩	通用Agent应用、RAG系统	与LlamaIndex生态系统无缝集成	记忆管理相对简单，缺乏复杂的记忆演化机制

从上表可以看出，不同的技术方案各有其优势和适用场景。MemGPT采用多级内存结构，能处理超长对话历史；MemoryOS通过三级分层记忆和四大核心模块，在性能上取得了显著提升；Reflexion则通过Actor-Evaluator-Self-Reflection架构实现了自我反思和进化；Mem0采用轻量级框架，结合向量数据库和图数据库实现混合存储；LlamaIndex记忆模块则与其生态系统无缝集成，但记忆管理相对简单。

3.2 记忆存储与检索技术

记忆的存储和检索是Agent记忆系统的核心技术环节，主要包括以下几种实现方式：

向量数据库（基于嵌入的召回）：
- 工具：FAISS、Pinecone、Weaviate、Qdrant、ChromaDB
- 优点：适合语义检索；高度可扩展，适应上下文相关性
- 缺点：向量计算代价高；召回质量依赖嵌入质量
- 适用场景：需要长时记忆但不想存储原始文本的聊天机器人知乎
基于token的上下文窗口（Sliding Window）：
- 工具：OpenAI Assistants API、LangChain Buffer Memory
- 优点：实现简单，成本低；不依赖外部存储
- 缺点："健忘"：旧数据不断被新数据挤出；不具备跨会话记忆
- 适用场景：仅需要当前会话上下文的简单助手知乎
混合存储架构：
- Mem0采用双重存储架构，结合向量数据库（用于记忆存储）和图数据库（用于关系追踪）稀土掘金
- MemoryOS采用段页式三级存储架构，借鉴了现代操作系统中成熟的内存管理原则知乎

3.3 记忆管理机制

有效的记忆管理是确保Agent记忆系统高效运行的关键，主要包括以下几个方面：

记忆压缩：通过LLM摘要、关键信息提取等方式，将冗长的对话历史压缩为精简的记忆表示。
记忆检索：根据当前任务或对话内容，从长期记忆中检索相关的历史信息。例如，MemoryOS采用热度驱动的检索机制51cto.com，而Mem0则采用语义搜索与图查询技术，根据信息重要性和时效性检索相关记忆稀土掘金。
记忆更新：随着交互的进行，不断更新记忆内容。例如，MemoryOS通过短期→中期→长期的动态归档机制知乎，而Mem0则持续更新存储信息并消除矛盾点，确保数据准确性稀土掘金。
记忆遗忘：通过时间衰减、重要性评分等机制，模拟人类的遗忘过程，避免记忆过载。

四、应用场景与案例分析

不同应用场景下的Agent对记忆机制有着不同的需求和实现方式：

应用场景	代表产品/项目	记忆架构特点	记忆内容重点	记忆检索机制	记忆更新策略	技术实现方式
角色扮演/情感交互	Character.ai	以用户为中心的长期记忆	用户偏好、历史对话、角色设定、情感连接	基于相似度的语义检索	持续累积用户交互信息，构建用户画像	向量数据库存储用户偏好，结合角色设定进行个性化回复
协作任务/项目管理	MetaGPT	结构化工作流记忆	SOP流程文档、需求文档、设计稿、代码等结构化内容	基于任务阶段的文档检索	随任务进展更新工作流文档	将工作流程中生成的文档作为记忆载体，不同角色Agent共享访问
软件开发	OpenDevin	事件流记忆架构	代码变更、终端输出、文件系统状态、执行命令历史	基于时序的事件检索	按时间顺序记录所有动作和观察	事件流按时序记录所有动作和观察，构成任务状态的完整记忆
操作系统/界面交互	Adept AI (ACT-1)	界面操作记忆	UI元素状态、用户操作序列、界面变化	基于界面状态的操作检索	通过观察界面变化更新记忆	通过Chrome扩展观察浏览器中发生的事情并采取操作
个人助理/长对话	MemGPT	多级内存结构	用户习惯、偏好、历史交互、重要事实	主要上下文和外部上下文间的函数调用	FIFO队列+外部记忆归档	主要上下文（系统指令、工作上下文、FIFO队列）+外部上下文
复杂推理/多轮任务	MemoryOS	三级分层记忆	实时对话、主题信息、个性化知识	热度驱动的检索机制	短期→中期→长期的动态归档	段页式三级存储架构，四大核心模块协同工作
反思学习/自我进化	Reflexion	Actor-Evaluator-Self-Reflection架构	任务轨迹、失败经验、反思结果	基于任务相似度的经验检索	通过反思结果更新长期记忆	将反思结果作为语言反馈存入长期记忆，指导未来决策

上表详细对比了七种典型应用场景下的AI Agent记忆机制实现，包括角色扮演/情感交互、协作任务/项目管理、软件开发、操作系统/界面交互、个人助理/长对话、复杂推理/多轮任务以及反思学习/自我进化。每种场景都有其独特的记忆架构特点、记忆内容重点、检索机制、更新策略和技术实现方式，以满足不同的应用需求。

4.1 角色扮演与情感交互

以Character.ai为代表的角色扮演型Agent，其记忆系统服务于个性化与情感连接。通过记录用户偏好和对话历史，塑造具有长期一致性的虚拟角色，从而提升用户粘性和角色扮演的沉浸感。这类Agent的记忆内容重点是用户偏好、历史对话、角色设定和情感连接，通过基于相似度的语义检索机制，持续累积用户交互信息，构建用户画像。

4.2 协作任务与项目管理

以MetaGPT为代表的协作任务型Agent，采用结构化工作流记忆。其记忆载体并非对话历史，而是由不同角色的Agent遵循标准作业程序（SOP）生成的结构化文档（如需求文档、设计图），这是一种面向任务协作的共享工作空间记忆。这类Agent的记忆内容重点是SOP流程文档、需求文档、设计稿、代码等结构化内容，通过基于任务阶段的文档检索机制，随任务进展更新工作流文档。

4.3 软件开发

以OpenDevin为代表的软件开发型Agent，其记忆核心是事件流（Event Stream）。这是一个按时间顺序记录所有动作（如代码写入、命令执行）和观察（如终端输出、文件状态）的日志，构成了Agent对任务完整状态的全面记忆，是其进行规划和决策的基础。这类Agent的记忆内容重点是代码变更、终端输出、文件系统状态、执行命令历史，通过基于时序的事件检索机制，按时间顺序记录所有动作和观察。

4.4 反思学习与自我进化

以Reflexion为代表的反思学习型Agent，通过Actor-Evaluator-Self-Reflection架构实现自我反思和进化。在这个框架中，Actor根据状态观测生成文本和动作，Evaluator对Actor的输出进行评价，Self-Reflection则生成语言强化线索帮助Actor改进promptingguide.ai。这种机制使Agent能够从失败中学习，通过将反思结果存入长期记忆，指导未来的决策。

资料来源：知乎 promptingguide.ai aps.arxiv.org 搜狐网

上图展示了Reflexion框架的工作流程，清晰地呈现了Actor、Evaluator、Self-Reflection和记忆（短期记忆和长期记忆）之间的交互关系。这种循环迭代的过程使Agent能够不断从经验中学习，提升自身的决策能力。

4.5 性能对比分析

Reflexion框架在不同应用场景中的性能表现如下：

资料来源：知乎 promptingguide.ai aps.arxiv.org

上图对比了Reflexion框架与基准方法在四种不同任务类型上的性能差异。可以看出，Reflexion在所有任务类型上都取得了性能提升，尤其是在编程任务-Rust（LeetCode Hard）上，性能提升高达32%。这表明，通过记忆与反思机制，Agent能够显著提升其在复杂任务上的表现。

五、前沿研究方向与挑战

5.1 记忆与反思机制

记忆与反思是Agent自我进化的关键机制。Reflexion框架通过让Agent对失败的行动轨迹进行自我反思，并将这些反思（语言形式的反馈）存入记忆，从而在后续尝试中指导其做出更优的决策知乎。这种机制使Agent能够在不更新模型参数的情况下从经验中学习，实现自我进化。

近期的研究表明，自我进化智能体（Self-Evolving Agents）是从静态LLM迈向超级智能ASI的重要路径钛媒体。这类Agent能够通过与环境互动、从经验中学习并持续自我完善，逐步提升自身的能力。

5.2 记忆的遗忘与巩固机制

人类记忆系统有着精妙的遗忘与巩固机制，这也是AI Agent记忆系统需要模拟的重要特性。研究者们正在探索模拟人类"艾宾浩斯遗忘曲线"或睡眠巩固等机制的算法，使Agent能智能地判断哪些记忆应该被遗忘、哪些应该被强化。

例如，MemoryOS通过热度驱动的动态更新机制和语义感知的多级检索算法，让AI学会"选择性记住"，并且"智能地忘记"51cto.com。这种机制使Agent能够在面对跨天、跨话题、多轮的复杂对话时，依然能够保持语境连贯、风格统一乃至价值取向的一致51cto.com。

5.3 多模态记忆融合

随着多模态大模型的发展，Agent记忆系统也需要能够处理和融合来自不同模态（如文本、图像、声音等）的信息。这涉及到如何表示、存储和检索多模态记忆，以及如何在不同模态间建立关联和映射。

研究者们正在探索Agent如何整合和利用来自视觉、听觉等非文本模态的记忆，特别是在机器人或具身智能场景下。这将使Agent能够更全面地感知和理解环境，做出更准确的决策。

5.4 记忆安全与隐私保护

随着Agent记忆系统的发展，记忆安全与隐私保护也成为重要的研究方向。如何确保Agent的记忆系统不会泄露用户隐私，如何防止恶意攻击者通过操纵Agent的记忆系统来影响其决策，都是需要解决的重要问题。

此外，如何设计可解释的记忆系统，使用户能够理解Agent是基于什么记忆做出的决策，也是提升用户信任的关键。

六、结论与展望

本报告系统地梳理了大模型Agent记忆机制的核心概念、技术实现、典型应用案例以及前沿研究方向。通过对比分析不同技术方案和应用场景下的记忆机制实现，我们可以得出以下结论：

分层混合架构是主流趋势：借鉴人类认知科学的分层记忆模型，结合短期记忆和长期记忆，是当前Agent记忆系统的主流架构。
记忆与任务耦合：不同应用场景下的Agent，其记忆系统的设计需要与具体任务紧密结合，如角色扮演型Agent注重用户偏好和情感连接，而软件开发型Agent则需要捕捉动态的环境状态。
记忆驱动自我进化：通过记忆与反思机制，Agent能够从经验中学习，不断提升自身的决策能力，这是实现真正智能Agent的关键路径。
技术实现多样化：从简单的上下文窗口到复杂的三级分层记忆，从向量数据库到图数据库，Agent记忆系统的技术实现呈现多样化趋势，以满足不同场景的需求。

未来，随着大模型技术的进一步发展，Agent记忆机制也将向着更加智能、高效、安全的方向演进。我们期待看到更多创新的记忆架构和算法，使Agent能够像人类一样，通过积累经验、反思学习，不断提升自身的能力，最终实现真正的通用人工智能。

参考文献

MemGPT: Towards Memory-Augmented Large Language Models as Operating Systems. arXiv:2310.08560.
MemoryOS: A Memory Operating System for Large Language Models. arXiv:2401.08424.
Reflexion: An Autonomous Agent with Dynamic Memory and Self-Reflection. arXiv:2303.11366.
Mem0: A Lightweight, Extensible Long-Term Memory Framework for LLM Agents. https://github.com/mem0ai/mem0
LlamaIndex: A Data Framework for LLM Applications. https://www.llamaindex.ai/

Source(270)

文件

[PDF] A survey on large language model based autonomous agents

知乎

基于大语言模型（LLM）的智能体最近引起了研究界和工业界的广泛 ... 本篇综述对基于LLM 的智能体的记忆机制进行了系统的回顾，其中重点关注三 ...

知乎

火山引擎开发者社区

稀土掘金

飞书

CSDN技术社区

新浪网

近期，基于大语言模型的智能体（LLM-based agent）在学术界和工业界中引起了广泛关注。对于智能体而言，记忆（Memory）是其中的重要能力，承担了记录过往信息和外部知识的功能，对于提高智能体的个性化等能力至关重要。中国人民大学高瓴人工智能学院与华为诺亚方舟实验室聚焦大语言模型智能体的记忆能力，在该领域的研究早期，形成了一套完整的包括综述论文、数据集和工具包的研究体系，致力于推动该领域的发展。...

飞书

对话交互历史是记忆的一部分，也是Agent多轮对话的基础。用户所输入的Query和模型最终返回的自然语言输出形成了对话的交互历史。 1.2.工作流（规划）与工具调用结果自然语言规划和工具调用在工作流上的区别，也会让其在工作流记忆的储存上有所区别在ReAct为基础架构的Agent结构中，规划或Thought是以自然语言的形式呈现的，有长期规划的Agent会在行动开始之前将任务拆解成...

澎湃

通用领域进化，指的是为通用应用而设计的自我进化 agent，即 agent 系统通过进化来拓展其在数字领域的多样化任务能力，主要通过三种方式实现能力升级：记忆机制（Memory Mechanism）、课程驱动训练（Curriculum-Driven Training）以及模型-agent 协同进化（Model-Agent Co-Evolution）。这三大机制共同作用，使智能助手能够不断适应复杂多变的用户需求，提供更高效的服务响应。专业领域进化，是指专注...

澎湃新闻

通过特定的记忆机制，代理可以有效地反思并应用先前的策略，使其借鉴过去的经验来适应陌生的环境。通常用于提升记忆能力的方法有三种：. 扩展Backbone ...

geyuyao.com

为了正确地表示学习到的知识或过去事件，并在推理中使用这些信息，一个agent需要有效地操作这些"记忆”。如何设计一种高质量的记忆机制，使agent能够有效检索 ...

火山引擎开发者社区

记忆增强规划. 大语言模型Agent应用在记忆方面主要有两种方法来增强规划能力：基于检索增强生成（RAG）的方法和基于嵌入式记忆（Embodied Memory，这里 ...

github.com

主要讨论了多模态人工智能系统，尤其是智能体Agent在物理和虚拟环境中的交互性。论文核心分为五个部分：Agent AI的概念、Agent AI存在的挑战、Agent AI的学习、Agent AI的 ...

新浪财经_手机新浪网

该综述从不同角度对智能体的记忆进行了全面讨论。该综述讨论了「什么是智能体的记忆」和「为什么智能体需要记忆」，总结回顾了「如何实现智能体的记忆」和 ...

文件

[PDF] (19)国家知识产权局

文件

[PDF] (19)国家知识产权局

36氪

点石科技

稀土掘金

知乎

一个基于大模型的AI Agent 系统可以拆分为大模型、规划、记忆与工具使用四个组件部分。 AI Agent 可能会成为新时代的开端，其基础架构可以简单划分为Agent = LLM + 规划技 ...

澎湃

通过特定的记忆机制，代理可以有效地反思并应用先前的策略，使其借鉴过去的经验来适应陌生的环境。通常用于提升记忆能力的方法有三种：扩展 Backbone 架构的长度限制：针对 Transformers 固有的序列长度限制问题进行改进。总结记忆（Summarizing）：对记忆进行摘要总结，增强代理从记忆中提取关键细节的能力。压缩记忆（Compressing）：通过使用向量或适当的数据结构对记忆进行压缩，可以提高记忆检索效率。此外，记忆的检索方法也很重要，只...

澎湃

Shunyu Yao 集智俱乐部导语语言智能体（Language Agent），即以大语言模型技术为基础的智能agent。如果负责任地部署，语言智能体对于通用人工智能（AGI）和大规模自动化现有人力劳动将具有巨大潜力，或许能开启新时代的可扩展人工智能与人类合作。然而，像所有新技术一样，我们也需要关注并有效减轻随之而来的风险，以避免不希望出现的结果。研究领域：语言智能体，通用人工智能，自动化社会 Shunyu Yao|作者刘培源|译者 ...虽然2022年是让像ChatGPT这样的语言模型引起公众关注的...

澎湃

大模型 Agent、接口和环境之间交互的交互机制；Agent 可用的沙盒操作系统+Web 浏览器环境；可创建和执行代码的接口；多 Agent 评估框架。目前，OpenDevin 的 GitHub 已经获得了超过 2.9 万 Star 量。近日，OpenaDevin 团队发布了该工具的技术报告。报告地址：https://arxiv.org/pdf/2407.16741 在技术报告中，OpenDevin 的作者，来自伊利诺伊大学香槟分校、卡...

百度百科

虚构症是指患者在回忆中将过去事实上从未发生的事或体验，说成是确有其事。患者就以这样一段虚构的事实来填补他所遗忘的那一片断的经过。某些脑器质性疾病患者由于记忆力的减退，而以想象的，无事实根据的一些经历或事迹填补记忆缺失，称为记忆性虚构症。记忆性虚构症（详见以下记忆虚构）表现为幻想性虚构症及睡梦性虚构症，前者带有幻想性质，后者多见于临床，阐述内容荒诞，变幻不定，丰富多样。总之，若患者有记忆力减退，...

cnblogs.com

FactExtractionMemoryBlock的实现方式，其实是2个大模型推理模块，分别负责事实性记忆抽取+记忆压缩，通过大模型抽取对话中用户提供的事实类信息。记忆压缩 ...

betteryeah.com

想掌握大模型Agent设计？本文拆解技术路线图全流程，涵盖需求分析、架构设计、组件开发等核心环节，结合2025年权威报告与案例，助你构建高效智能体系统！

飞书

目前，将临时记忆转换为长期记忆的最佳方法是定期对上下文对话内容进行总结，然后对总结后的文本进行索引，并将索引后的内容存储到数据库中，以此来维持长期记忆。在下面的 ...

稀土掘金

1. Agent什么东西可以存入记忆中？ · 1.1. 对话交互历史 · 1.2. 工作流（规划）与工具调用结果 · 1.3. Reflection的反馈 · 2. 记忆的提炼方式 · 2.1. 直接的buffer ...

mittrchina.com

... 大模型存在根本性不对称. 本次研究的主要贡献在于提出了一个统一的分类框架，该框架将上下文工程技术分为基础组件和系统实现方法两大块。 DeepTech深 ...

文件

[PDF] (19)国家知识产权局

知乎

SegmentFault 思否

飞书

知乎

记忆提取通常通过检索来实现，具体技术实现包括全文检索、向量检索 ... 记忆片段，这些记忆片段会通过Embedding 存储到向量数据库内。当前对话的 ...

东方财富网

51CTO

搜狐网

开源中国社区

推广 | Gitee「夏日解暑」代码征集上传坑爹代码赢清凉降温礼品一个在GitHub上标星超2万的数据库，究竟是什么来头？原来，这正是最近大火的向量数据库之一、首个在这一赛道开源产品Mi

tech.chinadaily.com.cn

我国垂直大模型在企业场景中的应用尚处于探索阶段,许多企业仍在寻求大模型的最佳落地方案,近年来,达观数据一直致力于探索垂直大模型,专注于垂直大模型的能力研究和技术研发,一直秉承联合探索垂直大模型领域的开放态度和合作精神。在本次2024世界人工智能大会携垂直大模型知识库举办“知识改变世界—垂直大模型重新定义知识管理”的主题论坛,分享垂直大模型<...

www.thepaper.cn

当前，大模型的发展处于一场充满无限可能的大变革前夜，而作为核心要素的大数据也被赋予了全新的意涵。大模型技术的出现对大数据而言意味着什么，大数据又将如何影响大模型的发展，这两者又如何能更好双向奔赴，带来新质生产力，进入2024年又会出现哪些技术的引爆点和杀手级应用?带着萦绕在大模型与大数据之间的种种问题，在“第六届金猿季&魔方论坛—大数据

51cto.com

矢量存储是一种特殊的数据库类型，与传统数据库存储文本或数字不同，它专门用于保存矢量数据。矢量是一组数字列表，能够表达文本的语义信息。

飞书

一、Agent概述 · 规划（planning）. 子目标分解：agent将大任务拆分为更小的可管理的子目标，使得可以有效处理复杂任务。 · 记忆（Memory）. 短期记忆：上下文学习即是利用模型的 ...

betteryeah.com

长期记忆：存储结构化数据（如用户画像、知识图谱），通过向量数据库（如Milvus）实现高效检索。关键挑战：如何平衡记忆的“容量”与“效率”？实践表明 ...

xie.infoq.cn

火龙果软件工程

记忆检索：长期记忆一般都会存在向量数据库里面，是个性化服务的关键，如何准确的检索出不同业务场景下的记忆数据，以及平衡检索效率与资源消耗的关系，这个其 ...

文件

[PDF] (19)国家知识产权局

知乎

SegmentFault 思否

稀土掘金

知乎

今日头条

飞书

知乎

3、短期记忆（Short-Term Memory）. 实现短期记忆的最直接方法是使用模型的上下文窗口，它本质上是LLM 可以处理的token数。

百度智能云

通过大模型提示工程（如ReAct、CoT推理模式），Agent可以具备类似人类的思维模式，精准拆解任务并分步解决。记忆（Memory）：Agent需要信息存储与回忆的能力。短期记忆用于存储会话上下文，以支持多轮对话；长期记忆则存储用户特征、业务数据等，以便快速检索和使用。这些信息对于Agent的决策和行动至关重要。工具（Tools）：Agent...

今日头条

随着大模型应用场景的不断拓展，其在处理长期对话时逐渐暴露出的记忆局限性日益凸显，主要表现为固定长度上下文窗口导致的“健忘”问题。针对这一挑战，北京邮电大学百家 AI 团队创新性地提出了首个模拟人脑记忆机制的大模型记忆操作系统 MemoryOS，其核心突破在于实现了分层记忆架构与动态更新策略的有机结合。MemoryOS 采用三级记忆体系模拟人脑认知机制

www.thepaper.cn

cnblogs.com

短期记忆通常用于存储和处理当前任务或会话中的信息。它的特点是容量有限，信息保留时间较短。以下是一些实现短期记忆的技术：. 缓存（Cache）： ...

阿里云

在智能体应用中启用长期记忆功能后，将自动创建长期记忆体（Memory）。长期记忆体通过记忆片段和记忆变量实现记忆管理。在调用智能体应用时，系统会根据传入的 ...

36氪

结合CoALA框架，我们按照信息的内容，将信息组织进Agent的多个记忆模块，包括短期工作记忆和三种长期记忆：情景记忆、语义记忆和程序记忆。 ... 短期记忆：.

飞书

短期记忆和长期记忆是基于其存储方式而定义的记忆概念。在实际使用Chat类以及Agent类应用的时候，在开启新的话题时，用户会选择开启新的Session（会话）来进行对话，这不仅是 ...

中国科学院

管理长期记忆很复杂，因为存在诸如决定存储哪种类型的记忆、确定存储什么、如何衰减旧的记忆以及如何将它们有效地检索到工作记忆中等挑战。管理长期记忆的 ...

知乎

上海东方财富证券投资咨询有限公司

大模型时代的AI AGENT = LLM + 规划能力+ 记忆+ 工具。AI领域AGENT概念由来已久，这一轮LLM给AI AGENT提供了突破性技术方案，对AI AGENT性能表现至关 ...

飞书

机器之心

知乎

m.betteryeah.com

搜狐网

m.betteryeah.com

本文将以“大模型Agent编排”为切入口，围绕多智能体系统协作的核心要素、关键技术架构、主流平台产品、典型应用场景、实践方法与常见陷阱、以及落地过程中的数据与安全挑战，进行体系化、全流程、案例驱动式深度剖析，并提供专家级的优化建议和前瞻观点。无论你是企业技术决策者、AI研发人员、还是关注智能体赛道的行业从业者，这里都能让你获得权威、实战、跨界的参考价值。一、多智能体协作的核心价值与典型场景 AI领域，单模型智能已远不能...

搜狐

方向二：智能体模拟，力图更加拟人可信。1）陪伴类智能体强调情感情商等人类特征，具有“人格”，且能够记住与用户的历史交流，代表应用如PI、Character ai、replica、glow等。我们认为国内情绪消费市场仍有较大想象空间，陪伴类智能体或受益于情绪消费趋势红利，成为LLM时代重要的AI原生应用。我们预计陪伴类智能体大部分商业价值集中在供给方而非平台，我们更加看好具备丰富IP储备或者能让用户定制智能体的玩家。2）交互智能体：强调与...

搜狐网

◼ 大模型时代的AI AGENT=LLM+规划能力+记忆+工具。AI领域AGENT概念由来已久，这一轮LLM给AI AGENT提供了突破性技术方案，对AI AGENT性能表现至关重要；同时需借助外部工具在实际应用中保持长期一致性和准确性。目前AI AGENT的探索大致分为自主智能体和智能体模拟。◼ 方向一：自主智能体，力图实现复杂流程自动化。自主智...

知乎

上面介绍了AI Agent 是什么以及一些案例演示，下面的内容将对AI Agent 背后的技术进行分析。一个基于大模型的AI Agent 系统可以拆分为大模型、规划、记忆与 ...

infoq.cn

AI Agent 与Chatbot 在处理复杂任务和协作方面有所不同，Agent 更复杂且不一定基于对话；. Agent 实际上和人类的分工相似，但并不完全相同；. 具身机器人是 ...

飞书

省流助手：这篇文章深入探讨了AI Agent（人工智能体）的概念、架构、与大模型的区别，以及如何构建和应用AI Agent，强调了AI Agent在实现自主任务执行和决策中的重要性。

promptingguide.ai

大语言模型（LLM）智能体，是一种利用大语言模型进行复杂任务执行的应用。这种智能体通过结合大语言模型与关键模块，如规划和记忆，来执行任务。构建这类智能体时，LLM充当着 ...

澎湃新闻

而随着MetaGPT等开源AI Agent的出现，更多技术供应商与创业团队引入Agent，更多组织认知并接受Agent，它必然会快速成为LLM的落地个领域的主要模式，助力千行 ...

文件

[PDF] Characteristic AI Agents via Large Language Models

知乎

腾讯

51cto.com

本指南将深入剖析Character AI的运行机制、功能特性、存在的局限性，同时将其与ChatGPT、Gemini、Janitor AI及Inworld等其他平台进行对比分析。

知乎

飞书

搜狐网

51CTO

让 AI 智能体拥有记忆能力，是为了让它变得更加有用、更具个性化，更像一个真正的人类伙伴，从而更好地为我们提供帮助。二、记忆增强型 AI 智能体系统的核心运作架构记忆增强型 AI 智能体系统是一个持续运行的认知闭环，使 AI 智能体能够感知环境、采取行动并从经验中不断学习。其运作过程可以分解为以下五个关键步骤：观察：AI 智能体首先感知任务或<...

我机网

更新：2025-04-10 10:52 大小：48.6M 类别：聊天.社区.交友系统：Android ...characte.ai是一款完全免费的聊天机器人软件，让用户在软件中能够...个性化创建对话：用户可以自由创建对话内容，定制机器人的回答，增加趣味性和个性化体验。快速解锁：软件简单易用，用户无需复杂操作即可快速上手，体验聊天机器人的魅力。【软件功能】多样化交流：支持多种类型的对话，涵盖日常聊天、兴趣爱好、学习...

环信

相比之下，一款名叫Character.ai的聊天机器人偷偷抢占了个性化AI聊天的赛道冠军。5月23日，Character.ai移动端正式登陆全球iOS和Android系统，在Google Play上表现尤为强劲。发布后短短48小时内，它在Android系统手机上的安装量超过70万次，领先于Netflix、Disney+和Prime Video等顶级娱乐应用程序。上市不到一周，它就吸引了超过170万用户...

aws.amazon.com

包括分析用户行为模式、对话主题、角色偏好、情感倾向等等，这样的分析结果，可以改进用户体验、提升模型的效能。实现个性化和智能化的服务。对 ...

知乎

特别是最近，GPT模型引入了一项创新功能——记忆（Memory）功能。这使得AI助手能够在与用户的交互过程中累积关键信息，从而提供更加定制化的服务。

飞书

我们最想做的事情是提高模型的记忆能力，因为我们的用户希望Character.AI 上的虚拟朋友可以记住他们，**这样用户能够使用大量的数据训练模型，提高Character 的个性化。

上海东方财富证券投资咨询有限公司

Character.AI采用GPT-3大模型并用大量书籍、电影和其他媒体中的虚构人物数据进行训练，使AI角色能够根据人物的个性和特征生成对话和文本响应。根据官方 ...

火山引擎开发者社区

生成多条差异化回复：当用户输入一句话后，AI 可一次性生成多种不同风格的回复（如关怀、霸道、俏皮等），用户可自选最喜欢的回应，满足个性化偏好。设置角色亲密度：AI 会根据与 ...

阿里云开发者社区

知乎

飞书

知乎

CSDN技术社区

阿里云开发者社区

搜狐网

阿里云开发者社区

www.thepaper.cn

相比于GPT-4的结果，MetaGPT在HumanEval数据集上相对提升了28.2%，而加入可执行反馈机制分别在HumanEval和MBPP上提升了4.2%和5.4%。在具有挑战性的SoftwareDev数据集上，MetaGPT在可执行性上的得分为3.75，非常接近4，而所需的运行时间较短(503秒)；生成的代码行数相对基线框架增加了2.24倍，而单位代码行数所消耗的token数下降了50%。这些结果突显了多智能体协...

知乎

## 备注本文介绍了性化的AI助手的发展和实操，并且在 https:// github.com/hengjiUSTC/n anoAgents/blob/main/personalized_agen

火山引擎开发者社区

什么是MetaGPT？ MetaGPT 是一个为基于大型语言模型（LLM）的多Agent系统设计的元编程框架。上图左侧展示了通信协议的示例，代理们通过共享的消息池发布结构 ...

阿里云

【AI Agent教程】【MetaGPT】由易到难，深入源码：看MetaGPT的长短时记忆如何实现. 大家好，我是同学小张，日常分享AI知识和实战案例欢迎点赞+ 关注 ...

飞书

记忆流：是一个长期记忆模块（外部数据库），用自然语言记录智能体经验的完整列表。每个元素都是一个观察结果，是由Agent 直接提供的事件。

m.aitntnews.com

系统2通过语言推理、记忆调用、自我思考和规划，将复杂问题拆解成由系统1组成的流程单元，分别执行不同的任务从而达到目的。并在多次实践和运用中沉淀为“ ...

智源社区

学术界也针对不同的记忆类型分别进行优化。以上提到的是单个Agent 的memory 管理情况。而在多智能体系统中，我们可以更加巧妙地利用 ...

文件

[PDF] Machine Theory of Mind

文件

[PDF] Learning Random Numbers to Realize Appendable Memory System for Artificial Intelligence to Acquire New Knowledge after Deployment

51cto.com

Character AI运作原理. Character AI构建于大型神经语言模型之上，其底层技术原理与ChatGPT、Gemini等背后的模型类似，均采用深度学习技术生成类人化文本。

aws.amazon.com

飞书

知乎

51CTO

SegmentFault 思否

飞书

尽管如此，Noam Shazeer 和 Daniel De Freitas 仍然决定通过他们的新公司 Character.ai 将这项技术分享给尽可能多的人。The technology is useful today—for fun,for emotional support,for generating ideas,for all kinds of creativity.Character.ai are not d...

SegmentFault 思否

本文深度解析了记忆增强型 AI 系统的核心技术架构，介绍了“观察→记忆→行动→反思→更新”这一认知闭环解决方案。作者还系统阐述了从实时内存状态到向量数据库的多层次存储机制，并详细解析了工作记忆、情景记忆和语义记忆这三种记忆类型。作者|Bhavishya Pandit 编译|岳扬是否总感觉你在和 AI 助手重复着同样的对话？你告诉它一些重要的事情，五分钟后，它就忘了。很长一段时间以来，这就是和大多数 AI 进行对话的现实情况。它们非常聪明，却只有金鱼般的...

SegmentFault 思否

本文将剖析8种常见的AI记忆方案，分析其原理、特点和场景，并用模拟代码帮助理解。全量记忆：不遗忘任何内容滑动窗口：固定长度的截断相关性过滤：遗忘次要信息摘要/压缩：提炼关键信息向量数据库：语义检索记忆知识图谱：结构化记忆分层记忆：短期与长期结合类OS内存管理：模拟Swap原理 01 全量记忆：不遗忘任何内容全量记忆模式是最基础、最容易实现的记忆策略。其核心理念是不遗忘任何历史上下文，每轮对话都将用户输入与智能体响应完整记录，并在后续请求中将全部历史上下...

搜狐网

为系统梳理AI记忆研究的演化趋势，作者基于统一的分类框架构建了一套大规模文献评估流程，覆盖2022至2025年间 NeurIPS、ICLR、ICML、ACL、EMNLP 和 NAACL 的三万余篇论文。通过GPT驱动的主题相关性打分系统，初步筛选出近四千篇潜在相关研究，并结合人工审核进一步精炼文献集。为衡量文献影响力，作者提出了相对引用指数（RCI,Relative Citation Index），借鉴医学领域的 RCR 思路，对引用量进行时间归一化，衡量论文在同期中的...

AIBetas

聊天记忆:Character.AI 正在逐步推出聊天记忆功能，允许用户添加重要信息，以便 AI 角色记住并在对话中引用。图像附件:用户可以将图像上传到与角色的聊天中，以便 AI 角色识别和响应图像内容.视频生成:通过 AvatarFX 模型，用户可以生成逼真的视频，使图像栩栩如生，并添加语音和对话。Scenes 和 Streams:用户可以在预设故事情节中插入他们的 AI 角色，或在...

智源社区

作者将AI中的记忆表示划分为参数化记忆与上下文记忆两大类，并提出六种基本记忆操作：巩固（Consolidation）、更新（Updating）、索引（Indexing）、遗忘（ ...

知乎

本文将从原理到实践，系统梳理AI Agent的核心理念、主流协议（如MCP、A2A）、思考框架（CoT、ReAct、Plan-and-Execute），并结合Golang生态下的工程化框架，深入 ...

知乎

本文首先分享AI 智能体的3阶段架构设计演进：LLM Agent、AI Agent、Muti Agent。然后对比剖析AI 智能体的3大关键技术：Function Calling、MCP、A2A。

齐思

- Character.AI已经开发了优化推理的技术，包括将注意力键值（KV）缓存的大小减小了20倍以上。 - 他们使用多查询注意力，混合注意力视野和跨层KV共享来实现 ...

华为

... 记忆机制来确保其熟练处理一系列连续任务。 ... 西部世界小镇中Agents 的架构记忆流包含大量的观察、检索过程记忆流是西部世界小镇中AI Agents 的架构核心。

知乎

github.com

阿里云开发者社区

51CTO

知乎

CSDN技术社区

阿里云开发者社区

阿里云帮助中心

删除一个事件流。删除一个事件流。接口说明删除一个事件流。调试您可以在 OpenAPI Explorer 中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer 可以自动生成 SDK 代码示例。调试授权信息下表是 API 对应的授权信息，可以在 RAM 权限策略语句的 Action 元素中使用，用来给 RAM 用户或 RAM 角色授予调用此 API 的权限。具体说明如下：操作：是指具体的权限点。访问级别：是指每个操作...

CSDN技术社区

邀请到IBM云计算高级咨询顾问张诚,IBM Event Stream 的应用场景技术特性,传统Message System的差异

文件

[PDF] Learning Random Numbers to Realize Appendable Memory System for Artificial Intelligence to Acquire New Knowledge after Deployment

知乎

飞书

SegmentFault 思否

m.betteryeah.com

知乎

oracle.com

www.thepaper.cn

新智元报道 alan 【新智元导读】为了搞钱，微软、OpenAI、谷歌和Meta纷纷瞄准Agent这片蓝海，各顶尖高校也紧随其后。Agent才是商业学术两开花的未来！大模型发展至今早已火成了一个「概念」。不管是学术界还是工业界，都要套上一层LLM的皮，方可彰显自己位于浪潮之巅。但是，搞AI的公司赚到钱...另一篇来自CMU、NVIDIA、微软和波士顿大学的论文介绍了AgentKit：一种使用自然语言构建AI Agent的机器学习框架。论文地址：https...

www.thepaper.cn

此次更新之前，360 AI搜索的CoE（collaboration-of-experts，专家协同）技术架构已经接入了包括百度、文心一言、通义千问、讯飞星火等在内的国内16家主流大模型。更新后，360 AI搜索的“切换大模型”功能提供了更多选择，用户可以在“标准回答”搜索模式下自由选择使用腾讯混元大模型来重新生成搜索答案。这种多模型接入的方式使得360 AI搜索能够根据用户搜索意图自动调用最合适的大模型，从而提升搜索的...

www.thepaper.cn

更早之前，明星创企Inflection、Character.AI、AI Agent独角兽企业Adept，纷纷迎来被大公司变相收购的命运。商业化手段有限，叠加大模型训练和推理费用高昂，入不敷出的国内部分头部大模型玩家，此前甚至被传出退出预训练的消息。即便不想放弃预训练，一些大模型玩家也开始转变策略，开始放弃在国内烧钱做To C市场的策略，转向全力发展更容易见到回头钱的ToB领域。商业化天花板有限，也成为字节内部将重心从豆包转向剪映和即梦的一大原因。据Que...

www.tsinghua.edu.cn

Powered by General Language Model(GLM),a LLM fully developed by Tsinghua,MAICs assist instructors in designing courses by automatically generating teacher agents,teaching assistant agents,and peer agents with diverse styles.This allows for the rapid creati...

华为

Reflexion：一个让AI Agent 具备动态记忆和自我反思能力以提高推理能力的框架。沿用了ReAct 中的设置，并提供简单的二进制奖励。每次行动后，AI Agent ...

mittrchina.com

然而，目前各种Agent 所使用的记忆模块往往是为特定任务专门设计的。例如，自动驾驶Agent 存储的是车辆的轨迹与状态数据，代码生成Agent 保存的是代码片段，而 ...

51cto.com

如何从0开始构建一个通用AI Agent 智能体架构设计和实现？ AI Agent ... AI 智能体记忆机制和架构设计详解. AI智能体. 记忆机制. AI助手.

开源中国社区

作者借鉴人类记忆机制，提出了一个创新的Agentic 记忆架构设计方案，包含记忆路由器、短期记忆模块和长期记忆模块。这个架构不仅可以处理语义记忆，还能通 ...

稀土掘金

本文深入探讨了AI Agent的核心技术和架构，揭示了智能体如何在复杂环境中实现自主交互。从基础的感知机制到高级的规划策略，再到记忆系统的构建和工具的 ...

tianqi.csdn.net

虎嗅网

这三块之间其实是纯粹的Agent和event stream的交互逻辑。用户交互是通过直接往event stream里加入信息来实现的。比如用户想让Agent做某件事，就直接把 ...

知乎

流式输出与事件监听：大部分适配模型支持流式输出，可通过事件监听 ... 其技术原理包括：模块化架构: 框架设计支持集成不同的组件，如各种工具 ...

百度百科

极客邦

博客园

微软公司

博客园

稀土掘金

1.背景介绍前言事件驱动架构（Event-Driven Architecture，EDA）是一种软件架构模式，它将系统的行为和功能建立在事件和事件处理器之间的通信和协作上。这种架构模式在现代软件系

bilibili

https://www.youtube.com/watch?v=T3Qkl59okjo,视频播放量 73、弹幕量 0、点赞数 3、投硬币枚数 0、收藏人数 6、转发人数 0,视频作者超级总架构师,作者简介&现【架构师】，曾当程序员和工程师10多年。公号:【超级架构师】,$vx【jiagoushi_pro】¥赶快关注吧，相关视频：【流处理】使Cassandra流入到Kafka_by Yelp。技术架构#架构师#程序员#...

Microsoft Learn

StreamInsight提供了EventFlowDebugger以方便用户进行事件流调试。这一工具拥有直观的图形化界面，支持即时调试和日志调试，支持跟踪和回溯。本文将介绍EventFlowDebugger基本使用方法。EventFlowDebugger分为在线模式和离线模式两种使用方法。在线模式下，用户连接到StreamInsight服务器，在线进行调试，或者录制某一段时间的事件流供离线模式使用。离线模式下，用户通过加载Trace文件对事件流进行调试。...

github.com

这项研究提供了一个框架，它通过实现新的技术手段来增强与LLMs的交互，包括改善与编程语言的兼容性，使能LLMs使用外部工具，并维护历史交互信息，并以此指导未来的研究 ...

上海东方财富证券投资咨询有限公司

生成式AI数据中心电力与可持续性差距。拟建的生成式AI数据中心电力需求急剧增长，并寻求低碳电. 力，这在其需求与电网容量及公司可持续发展目标之间产生 ...

腾讯云

AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态，通过六大核心模块的系统化组织，为不同层次的学习者和开发者提供从完整学习路径。

researchgate.net

In this paper, we introduce OpenDevin, a platform for the development of powerful and flexible AI agents that interact with the world in similar ways to those ...

知乎

github.com

Welcome to our list of AI agents. We structured the list into two parts: To filter the products by categories and use-cases, see the web version of this list.

新浪财经

www.archdaily.cn

Journal of Computer Science and Technology (JCST)

腾讯云

博客园

掌桥科研

Computer architecture;Public key cryptography;Software;Security;Virtualization;13.Network Resource Scheduling For Cloud/Edge Data Centers 机译：云/边缘数据中心的网络资源调度作者：Yuhan Zhao;Wei Zhang;Meihong Yang;Huiling Shi 会议名称：《IEEE International Performance Comp...

www.zmetro.com

Their solution became one of the most successful information architecture projects in history – the Vehicle Identification Number standard. Dotted around the Scottish countryside,honesty boxes are a heartwarming tradition reflecting the trust and ...

CSDN技术社区

该框架支持TOGAF（The Open Group Architecture Framework）企业架构开发框架，这是一个广泛认可的企业架构框架，用于指导企业IT系统的规划、设计、实施和治理。OpenExpressApp通过支持TOGAF，帮助企业更好地管理. ArcGIS RIA 开发实践 173 浏览量 1.1 RIA技术介绍*RIA（Rich Internet Applications）即富互联网应用程序，是一种利用客户端技术（如Flash、Silverlig...

github.com

Event-based Vision Resources. Community effort to collect knowledge on event-based vision technology (papers, workshops, datasets, code, videos, etc). 3.2k ...

dl.acm.org

This paper reports on the results of an independent analysis of the event-steam incident. A series of steps allowed the attacker to take control of important ...

openreview.net

This paper introduces Event Stream GPT (ESGPT), an open-source library designed to extend the applicability of Generative, pre-trained transformers (GPTs) to ...

GitHub Pages

This document discusses an approach to building event sourced systems. The use cases, architecture patterns and implementation details using both AWS native ...

arxiv.org

In this paper we describe the MDML and show how it is used in advanced manufacturing to act on IoT data and orchestrate distributed ML to guide ...

文件

[PDF] Learning Random Numbers to Realize Appendable Memory System for Artificial Intelligence to Acquire New Knowledge after Deployment

知乎

飞书

SegmentFault 思否

m.betteryeah.com

知乎

oracle.com

www.thepaper.cn

www.tsinghua.edu.cn

华为

Reflexion：一个让AI Agent 具备动态记忆和自我反思能力以提高推理能力的框架。沿用了ReAct 中的设置，并提供简单的二进制奖励。每次行动后，AI Agent ...

mittrchina.com

51cto.com

如何从0开始构建一个通用AI Agent 智能体架构设计和实现？ AI Agent ... AI 智能体记忆机制和架构设计详解. AI智能体. 记忆机制. AI助手.

开源中国社区

稀土掘金

知乎

智源社区

腾讯云

Adept AI 推出了Action Transformer (ACT-1) 大模型，这是一种可以在数字世界中采取行动的大型模型。这种新模型经过训练可以使用现有的所有软件工具 ...

搜狐网

36氪

php中文网

搜狐网

知乎

论文地址： https:// arxiv.org/pdf/2412.0976 4 论文名称： Memory Layers at Scale u200b 本文提出了一种memory layer用于

搜狐网

Adept的第一个产品名为Action Transformer（ACT-1）模型，可以深入理解人类与计算机的互动方式，其能力从解答基本问题逐渐扩展至执行更复杂的操作，比如，通过深入使用电子表格等工具，ACT-1 可以从上下文中推断出人们的意思，并帮助人们完成后续的一系列操作。2024年1月，Adept 又发布了多模态大型语言模型Fuyu-Heavy，进一步提升了在文...

上海东方财富证券投资咨询有限公司

4）Adept：发布了自研的大模型Action Transformer (ACT-1)，今年3 月宣布获得来自包括. 微软、英伟达在内的3.5 亿美元B 轮融资；. 5）Cohere：主要业务 ...

知乎

... 实现了感知算法端到端的大模型架构开发。一方面，特斯拉通过Transformer 的交叉注意力机制能够实现2D 特征图到3D向量空间的直接转换，且在成功转换后 ...

36氪出海

Adept AI目前的主要目标是基于生成式AI技术来做的一款通用操作工具 ... 目前，该产品主要由Adept AI自研的大模型Action Transformer (ACT-1)来实现。

51cto.com

Adept AI 推出了Action Transformer (ACT-1) 大模型，这是一种可以在数字世界中采取行动的大型模型。这种新模型经过训练可以使用现有的所有软件工具 ...

上海东方财富证券投资咨询有限公司

大模型时代的AI AGENT = LLM + 规划能力+ 记忆+ 工具。AI领域AGENT概念由来已久，这一轮LLM给AI AGENT提供了突破性技术方案，对AI AGENT性能表现至关 ...

文件

[PDF] An In-depth Survey of Large Language Model-based Artificial Intelligence Agents

钛媒体

知乎

bigai.ai

搜狐网

CSDN技术社区

ITPUB博客

机器之心

地球上最早的生命证据至少可以追溯到 35 亿年前，而直到大约 25 万到 40 万年前，智人才出现地球上。在这漫长的岁月中，生物不断地兴盛又覆灭，但整体趋势总是越来越复杂，其中最复杂的生物组件莫过于我

搜狐网

SakanaAI 震撼发布了 DarwinGödelMachine(DGM)，一个能够通过重写自身代码来实现进化的 AI Agent。这一突破性进展，标志着人工智能研究领域长期追求的“自我进化”目标迈出了坚实的一步。DGM 的诞生，预示着 AI 技术发展方向的重大转变，从静态部署走向动态演进，引发了业界对未来 AI 发展潜力的广泛关注。自我进化的核心机制：达尔文

搜狐网

本文将深入解析Reflexion的基本概念、实现过程，以及其与传统AI模型的区别，探讨这一模式在智能体自我反思和提升精准度方面的潜力。Reflexion设计模式概述 Reflexion本质上是对BasicReflection的升级，结合了强化学习的优秀特性和自我反思的机制。这一设计模式由Responder和Revisor两部分组成。Responder根据用户输入生成初步回答，同时进行批判式思考，并尝试...

飞书

Reflexion是一个框架,通过动态记忆和自我反思能力来提升智能体的推理技能。 ... AI Agent 前沿的研究方向。 **基于Prompt 的与大模型互动的方式更像是静态的“输入 ...

techflowpost.com

"近年来，基于大型语言模型（LLM）的自主代理在架构、记忆、感知、推理与行动等方面不断发展，在多个领域展现出重新定义可能性的潜力。"

aclanthology.org

此外，当前研究中的. 主要方法强调使用记忆和自我演化技术，根据反馈适应个体智能体。尽管对于每个个体智能体. 有效，但这些方法未能充分利用多智能体系统的潜在集体智能。

智源社区

Mobile-Agent-E 首次在移动手机场景中引入“自我进化模块”，赋予其类似人类使用手机时逐步变得更熟练的能力。具体来说，作者从认知科学中汲取灵感，定义了两种 ...

cnblogs.com

自我反思（Self-Reflection）：这个角色由大语言模型承担，能够为未来的试验提供宝贵的反馈。自我反思模型利用奖励信号、当前轨迹和其持久记忆生成具体且相关的反馈 ...

文件

[PDF] An In-depth Survey of Large Language Model-based Artificial Intelligence Agents

知乎

promptingguide.ai

搜狐网

SegmentFault 思否

知乎

新浪

东方财富网

在人工智能领域，AI Agent的设计和实现一直是研究和应用的热点。本文深入剖析了LATS（Language Agent Tree Search）这一前沿的AI Agent设计框架，供大家参考。在

腾讯网

在后续文章中，风叔将沿着上图的脉络，结合产品流程和源代码，详细介绍这八种AI Agent设计模式。为什么选择结合源代码呢？因为在AI大模型时代，很多的概念和方法都太新了。只有结合源代码，产品经理才能真正理解背后的原理和逻辑，才能知道什么能做，什么不能做，AI的边界在哪里，以及该如何与人类经验配合。下面，我们先从ReAct模式开始。一、ReAct的概念 ReAct的概念来自论文《ReA...

飞书

基于大模型的 Agent 基本组成应该包含规划（planning)，工具（Tools)，执行(Action)，和记忆(Memory)四个方面，上一篇中多轮对话中让AI保持长期记忆的8种优化方式（附案例和代码）重点讲了进行长记忆管理的 8 种方案，本节将从 Agent 概念、ReAct 框架、示例、以及一些论文思路来具体聊下任务规划的话题，同时...

飞书

这篇论文介绍了一种名为Reflexion 的新框架，用于强化语言代理通过语言反馈进行学习，而不是通过更新权重。具体来说，Reflexion 代理会口头反思任务反馈信号，并将自己的反思 ...

cnblogs.com

Reflexion：一个让AI Agent 具备动态记忆和自我反思能力以提高推理能力的框架。沿用了ReAct 中的设置，并提供简单的二进制奖励。每次行动后，AI Agent 都会 ...

华为

记忆：用有限的上下文长度实现更多的记忆. 记忆模块负责存储信息，包括过去的交互、学习到的知识，甚至是临时的任务信息。对于一个智能体来说，有效的记忆机制 ...

飞书

长期记忆:提供一个外部向量存储,智能体可以在查询时进行访问,实现快速检索,以获取大量信息。工具使用. 智能体可以调用外部API获得模型权重中所没有的额外信息,包括实时 ...

智源社区

一个为AI Agents 提供动态记忆和自我反思能力，以提高推理能力的框架。该框架采用标准的强化学习设置，其中奖励模型提供简单的二元奖励（0/1），动作空间遵循 ...

cnblogs.com

以下是一个在智能体中使用Memory的示例，短期记忆默认使用Memory初始化，直接传入Agent的运行过程中，Agent每一步运行都会调用finalize方法来更新Memory。

51cto.com

cnblogs.com

稀土掘金

微博

知乎

澎湃新闻

稀土掘金

搜狐网

因为使用的都是基于 Cent OS 的最小化精简安装，安装后会缺少一些常规的基础软件，所以我们会适当补充一些基础软件，以帮助快速排查和定位问题。yum install-y tree ntpdate bc nc net-tools wget lsof rsync nmon bash-completion iptables-services firewalld sysstat mtr htop bind-utils yum-utils epel- release smartmonto...

百度智能云

Memory Stream正是这种“记忆”的存储方式，它使AI Agent能够熟练处理一系列连续任务。2.决策与行动 AI Agent的决策能力是其智能的核心。基于感知到的环境和记忆中的经验，AI Agent需要制定行动策略以实现其目标。这通常涉及复杂的逻辑推理和决策过程，包括子目标与分解、反思与完善等。子目标与分解：在解决问题时，AI Agent...

百度智能云

简介：本文深入探讨了AI Agent的技术原理，包括其感知、决策和执行能力，以及通过记忆、推理和自我反思等机制实现复杂任务处理的能力。同时，文章还详细分析了AI Agent在多个领域的应用场景和未来发展趋势。在人工智能领域，AI Agent 作为一种能够感知环境、进行决策和执行动作的智能实体，正逐渐展现出其强大的潜力和广泛的应用前景。本文将从AI ...

知乎

记忆（Memory）：长期记忆存储与上下文管理，用于处理复杂任务; 工具使用（Tool Usage）：通过API或外部工具增强Agent的能力（如搜索、文件操作，代码执行等）.

阿里云

3. 总结总得看下来，MetaGPT的记忆模块其实实现的很简单，主要是在短时记忆上面进行了实现。对于长时记忆，只是简单的实现了将其存入了向量数据库，可以选 ...

稀土掘金

这类似于短期记忆，但在实现上，除了基于提示词，会话内记忆还可以通过外部数据库进行扩展和强化。这种记忆方式能够让智能体在当前会话中保持上下文的连续性， ...

blog.gitcode.com

MemGPT作为一个先进的AI代理框架，其核心功能之一是通过内存块（Memory Blocks）来管理代理的长期记忆。在最新版本中，开发团队发现了一个关键性问题 ...

知乎

MemGPT允许LLM自己生成函数调用来实现主要上下文和外部上下文之间的数据移动。实现方式是在prompt中告诉LLM：1)记忆分层和每层的作用，2)每个函数的schema。函数 ...

24h.jrj.com.cn

8月18日，阿里云宣布，表格存储Tablestore全面升级AI场景支持能力，正式推出AI Agent记忆存储功能，整体存储成本降低30%。