分层记忆系统与长期记忆管理

概述

Agent 记忆系统是所有 Agent 能力的底层基础设施。核心挑战:在极长对话(数万轮)中保持高质量响应。解法是分层的记忆系统设计,从工作记忆到长期记忆,配合生命周期管理。

7 区记忆模型(Hermes Agent 实践)

2026-06-07 在 Hermes Agent 上完成的记忆系统重构验证了以下设计:

IDENTITY → PROJECTS → RULES → QUICKREF → PENDING → LESSONS → GROWTH
用途管理方式
IDENTITY角色定义、Agent 分工持久化
PROJECTS当前活跃项目上下文项目结束后归档
RULES核心行为规则(含边界四档)用户偏好驱动
QUICKREF工具设施一句话速查引用扩展
PENDING待推进事项,[DUE:日期]会话结束自动检查
LESSONS近期教训(按日期倒序)超 5 条自动合并到 RULES
GROWTH自我认知(known_gaps / growth_edges)定期刷新

落地成果

指标重构前重构后
条目数62 条7 区
字数7,8792,059 (-74%)
总注入12,3362,534 (-79%)

生命周期标记

  • [PERMANENT] — 永不删除(角色定义、核心规则)
  • [LONG] — 长期保留(项目上下文、成熟经验)
  • [CONTEXTUAL] — 会话期间有效
  • [LOG] — 记录性,不主动注入
  • [TEMP] — 临时,带 [EXPIRY:日期],过期自动清理

经典理论:互补学习系统 (CLS)

McClelland, McNaughton & O’Reilly (1995) — 脑科学对记忆系统最重要的贡献之一:

脑区功能Agent 映射
海马体快速编码新经验,容量有限增量倒排索引
新皮层慢速整合结构化知识,容量巨大冷备压缩存储
睡眠记忆巩固5-10 倍速重放,转移记忆离线批量压缩

关键机制:模式分离(区分相似经历)vs 模式完成(从部分线索重建完整记忆)。

记忆 Provider 生态

Provider存储方式独特优势量级
HonchoPostgreSQL + Dialectic 推理多 Agent 隔离、双层上下文注入中等
Hindsight知识图谱 + 4 策略检索4 种并行检索策略中-重
HolographicSQLite + FTS5/HRR零外部依赖、矛盾检测轻量
Mem0向量搜索 + 图谱自动记忆管理、SOC 2 合规中等
RetainDB混合搜索 + Delta 压缩LongMemEval SOTA、p95 <40ms中等
ByteRover层级知识树CLI 优先、本地化轻-中

Codex CLI 上下文管理(对比参考)

OpenAI Codex CLI 采用 stateless 三层架构:

机制触发条件
Prompt Caching(主力)stateless 请求,保证精确前缀cache miss:换工具/模型/配置/MCP 顺序
自动压缩(兜底)opaque 压缩块(encrypted_content)model_auto_compact_token_limit 默认 200K
可调参数compact_prompt、tool_output_token_limit 等按需

对比总结:

维度Codex CLIHermes AgentClaude Code
模型statelessstateful(session_id)stateful
压缩opaque encrypted blockLLM summarizer(可审计)/compact 命令
缓存层Prompt Caching 自动需手动管理Claude API 缓存层
上下文窗口4K-16K1M
合规ZDR 零数据留存可控

记忆研究方向

  1. 记忆分层模型 — 工作记忆/短期/长期的分界阈值
  2. 存储层设计 — 向量 vs 结构化 vs 混合
  3. 写入策略 — 提取时机、去重合并
  4. 检索策略 — 主动预取/按需懒加载/排序加权
  5. 压缩遗忘 — 层级摘要、时间衰减、间隔重复
  6. 生命周期 — 分层转移、过期清理

2026-06 论文速览

  • MMPO (Meta-Cognitive Memory Policy Optimization) — 提出信念熵(Belief Entropy)作为自监督代理衡量记忆质量,显式惩罚导致高认知不确定性的摘要。在 1.75M token 上下文中保持 97.1% 性能(2605.30159)
  • MemTrain — 自监督上下文记忆训练框架,通过端到端掩码重建 + 中间记忆召回双目标联合优化,无下游数据即可提升记忆密集型推理最高 +17.67 分(2606.03197)
  • Memory Poisoning Attacks — 首次系统研究 Agent 记忆投毒攻击,揭示从不可信输入到可信记忆的安全漏洞(2606.04329)
  • CL-Bench — 持续学习基准发现专用记忆系统在持续学习上反而不如简单 ICL,对记忆系统设计路径有直接冲击(2606.xxxxx)
  • MRAgent — 基于图的联想记忆(线索-标签-内容)结合主动重建策略,在 LoCoMo 和 LongMemEval 上提升 23%,同时降低 token 成本(2606.xxxxx)
  • TriMem — 三粒度记忆架构:原始对话片段(保真)、原子事实(高效检索)、合成 profile(深度推理),TextGrad 驱动无需参数更新(2605.19952)
  • AgingBench — 识别 Agent 四种衰老机制(压缩/干扰/修订/维护),系统研究长期部署中的可靠性衰减(2605.26302)

相关页面:MemorySystem ComplementaryLearningSystem DialecticReasoning Honcho MemorySystem PlasticLabs