(2509.24704)= # 2509.24704_MemGen: Weaving Generative Latent Memory for Self-Evolving Agents * 首页: * PDF: * 引用: 3(2025-12-26) * 组织: * National University of Singapore * GitHub: ## 总结 ![](https://img.zhaoweiguo.com/uPic/2025/12/zGvFOk.jpg) Figure 1 The comparison among parametric memory, retrieval-based memory and MemGen. ![](https://img.zhaoweiguo.com/uPic/2025/12/t2iTSO.jpg) Figure 2 The overview of our proposed MemGen. ## From Moonlight ### 三句摘要 1. 💡 MemGen提出了一种动态生成式latent memory框架,通过将记忆与推理过程紧密交织,以克服现有LLM agent memory系统在灵活性和整合性上的局限。 2. ⚙️ 该框架包含一个经RL训练的memory trigger,用于智能地判断何时触发记忆调用,以及一个memory weaver,负责生成machine-native的latent token sequence以丰富agent的实时推理状态。 3. 📈 MemGen在八个benchmark上实现了显著的性能提升,展现出强大的跨领域泛化能力和持续学习能力,并自发演化出类似人类的planning memory、procedural memory和working memory等记忆功能。 ### 关键词 - MemGen: 是一种动态生成式记忆框架,旨在为大型语言模型(LLM)驱动的智能体提供一种更具人类特征的认知能力。它通过一个由强化学习训练的“记忆触发器”和一个“记忆编织器”协同工作,使得智能体能够在推理过程中按需生成和融入机器原生的潜在记忆(latent memory),从而实现推理与记忆的流畅交织和智能体能力的自我演进。 - Parametric Memory: 指的是一种将经验直接内化到智能体模型参数中的记忆范式。这种方法通过直接更新模型参数来存储和利用过去的经验,但可能导致灾难性遗忘(catastrophic forgetting),即在新知识的学习过程中,模型会丢失旧的知识。 - Retrieval-based Memory: 指的是一种将过去经验外部化并存储在结构化数据库中的记忆范式。智能体通过查询数据库来检索相关信息,然后将检索到的上下文信息提供给模型。这种方法避免了参数更新带来的灾难性遗忘,但其有效性依赖于复杂的上下文工程,并且通常缺乏与推理过程的流畅集成。 - Latent Memory: 指的是一种利用潜在状态(latent states)作为机器原生、高密度载体的记忆形式。它通过在模型的潜在空间中编码和表示经验,提供了一种比传统参数记忆或检索记忆更具柔性、更高效的记忆机制。MemGen 框架的核心就是利用这种潜在记忆。 - Memory Trigger: 是 MemGen 框架的组件之一,它充当一个元认知监视器,负责监测智能体推理过程中的认知状态。当识别到关键的思考时刻或需要记忆辅助时,它会决定是否调用记忆编织器来生成或检索记忆。其目标是在保持效率的同时,确保在关键节点进行记忆调用。 - Memory Weaver: 是 MemGen 框架的另一个核心组件,它负责根据智能体的当前状态(特别是触发器捕获的认知状态)来合成(synthesize)机器原生的潜在记忆(latent memory)。这个过程可能融合了智能体自身的参数化知识或外部检索的信息,并将这些信息整合成一个紧凑的、易于模型利用的潜在token序列。 - Reasoning: 指的是智能体进行思考、分析、推理以解决问题或做出决策的过程。MemGen 的关键创新在于实现了推理与记忆的“无缝交织”,即记忆的生成与融入是动态发生的,并与推理过程相互促进,形成一个循环。 - Cognition: 指的是智能体执行心智活动(如思考、学习、记忆、推理)的总体能力。MemGen 旨在赋予智能体一种更接近人类的“类人认知”(human-esque cognitive faculty),通过其动态的记忆生成和整合机制,模拟人类大脑中记忆与认知之间相互塑造的过程。 - Catastrophic Forgetting: 指的是在神经网络学习新任务或新数据时,遗忘之前学到的知识的现象。这是传统参数记忆方法(如微调)的一个主要缺点。MemGen 通过将新经验内化到记忆编织器而非核心推理器(reasoner)的参数中,旨在减轻或避免此问题。 - Cross-domain Generalization: 指的是智能体在不同类型或领域的任务上都能表现良好的能力。MemGen 在实验中被证明具有很强的跨领域泛化能力,即在某个领域的训练可以提升在其他领域的表现,或者即使在不同领域的数据上进行训练,其记忆机制也能有效地适应。 - Continual Learning: 指的是智能体在持续学习新任务或新数据时,能够保持对先前任务的性能,避免知识的遗忘。MemGen 通过其机制,如将知识存储在独立的记忆组件而非核心模型参数中,表现出更稳定的持续学习能力,减轻了灾难性遗忘。 - Planning Memory: 是 MemGen 在无显式监督的情况下,自发演化出的一种人类特有的记忆功能。它专门支持智能体进行高级任务规划和策略性推理,帮助模型分解复杂任务并序列化其推理步骤。 - Procedural Memory: 是 MemGen 自发演化出的另一种记忆功能。它负责存储和调用任务特定的操作性知识,例如工具的使用、API的调用、以及答案的格式化等具体执行技能,支持智能体高效地执行具体动作。 - Working Memory: 是 MemGen 自发演化出的记忆功能之一,它负责在当前任务会话中维持和有效利用先前的上下文信息,以保持推理的一致性和连贯性。它帮助智能体在较长的交互过程中不丢失关键信息。 - Latent Computation: 指的是一种利用潜在状态(latent states)来干预或重塑大型语言模型推理过程的计算范式。MemGen 将潜在记忆作为一种形式的潜在计算,用以增强推理能力。 - Reinforcement Learning (RL): 是一种机器学习方法,智能体通过与环境互动,根据收到的奖励信号来学习最优策略。MemGen 使用 RL 来训练其“记忆触发器”,使其学会何时最有效地调用记忆。 ### 摘要 MemGen提出了一种名为MemGen的动态生成式记忆框架,旨在为大型语言模型(LLM)驱动的智能体(agent)提供类似人类的认知能力。它通过将推理与记忆合成紧密交织,克服了现有参数化记忆(parametric memory)和检索式记忆(retrieval-based memory)的局限性。 **问题背景与动机:** 现有智能体记忆范式存在显著缺陷: 1. **参数化记忆**:直接修改模型参数,易导致灾难性遗忘(catastrophic forgetting)。 2. **检索式记忆**:将经验存储于外部数据库,虽然避免了灾难性遗忘,但其效果受限于上下文工程,且无法实现记忆与推理的流畅、无缝集成。 3. **现有隐式记忆(latent memory)**:主要关注长上下文处理或通过LLM参数更新存储经验,缺乏推理与记忆的无缝交织,且本质上仍是检索而非生成式的。 MemGen旨在解决“如何将智能体记忆设计为一种动态认知能力,使其能够与推理无缝地进行流动和重构”这一核心问题。 **核心方法(Methodology):** MemGen由两个协同组件构成: 1. **记忆触发器(Memory Trigger,$T_{\text{trigger}}$)**: * **功能**:作为元认知监控器,连续监测智能体的推理状态,判断何时需要显式调用记忆(即进行“反思”)。它决定在哪个时间点(token generation step)进行记忆插入。 * **实例化**: $T_{\text{trigger}}$被实现为一个轻量级的LoRA适配器(LoRA adapter),附着在冻结的推理核心LLM $\pi_\theta$上。 * **激活策略**:为避免过度的计算开销,采用句子粒度激活策略,即只在分界符(如逗号、句号)处考虑触发。 * **决策过程**:给定推理核心的当前隐藏状态序列 $H_{t,