分层记忆系统与长期记忆管理
概述
Agent 记忆系统是所有 Agent 能力的底层基础设施。核心挑战:在极长对话(数万轮)中保持高质量响应。解法是分层的记忆系统设计,从工作记忆到长期记忆,配合生命周期管理。
7 区记忆模型(Hermes Agent 实践)
2026-06-07 在 Hermes Agent 上完成的记忆系统重构验证了以下设计:
IDENTITY → PROJECTS → RULES → QUICKREF → PENDING → LESSONS → GROWTH
| 区 | 用途 | 管理方式 |
|---|---|---|
| IDENTITY | 角色定义、Agent 分工 | 持久化 |
| PROJECTS | 当前活跃项目上下文 | 项目结束后归档 |
| RULES | 核心行为规则(含边界四档) | 用户偏好驱动 |
| QUICKREF | 工具设施一句话速查 | 引用扩展 |
| PENDING | 待推进事项,[DUE:日期] | 会话结束自动检查 |
| LESSONS | 近期教训(按日期倒序) | 超 5 条自动合并到 RULES |
| GROWTH | 自我认知(known_gaps / growth_edges) | 定期刷新 |
落地成果
| 指标 | 重构前 | 重构后 |
|---|---|---|
| 条目数 | 62 条 | 7 区 |
| 字数 | 7,879 | 2,059 (-74%) |
| 总注入 | 12,336 | 2,534 (-79%) |
生命周期标记
[PERMANENT]— 永不删除(角色定义、核心规则)[LONG]— 长期保留(项目上下文、成熟经验)[CONTEXTUAL]— 会话期间有效[LOG]— 记录性,不主动注入[TEMP]— 临时,带[EXPIRY:日期],过期自动清理
经典理论:互补学习系统 (CLS)
McClelland, McNaughton & O’Reilly (1995) — 脑科学对记忆系统最重要的贡献之一:
| 脑区 | 功能 | Agent 映射 |
|---|---|---|
| 海马体 | 快速编码新经验,容量有限 | 增量倒排索引 |
| 新皮层 | 慢速整合结构化知识,容量巨大 | 冷备压缩存储 |
| 睡眠记忆巩固 | 5-10 倍速重放,转移记忆 | 离线批量压缩 |
关键机制:模式分离(区分相似经历)vs 模式完成(从部分线索重建完整记忆)。
记忆 Provider 生态
| Provider | 存储方式 | 独特优势 | 量级 |
|---|---|---|---|
| Honcho | PostgreSQL + Dialectic 推理 | 多 Agent 隔离、双层上下文注入 | 中等 |
| Hindsight | 知识图谱 + 4 策略检索 | 4 种并行检索策略 | 中-重 |
| Holographic | SQLite + FTS5/HRR | 零外部依赖、矛盾检测 | 轻量 |
| Mem0 | 向量搜索 + 图谱 | 自动记忆管理、SOC 2 合规 | 中等 |
| RetainDB | 混合搜索 + Delta 压缩 | LongMemEval SOTA、p95 <40ms | 中等 |
| ByteRover | 层级知识树 | CLI 优先、本地化 | 轻-中 |
Codex CLI 上下文管理(对比参考)
OpenAI Codex CLI 采用 stateless 三层架构:
| 层 | 机制 | 触发条件 |
|---|---|---|
| Prompt Caching(主力) | stateless 请求,保证精确前缀 | cache miss:换工具/模型/配置/MCP 顺序 |
| 自动压缩(兜底) | opaque 压缩块(encrypted_content) | model_auto_compact_token_limit 默认 200K |
| 可调参数 | compact_prompt、tool_output_token_limit 等 | 按需 |
对比总结:
| 维度 | Codex CLI | Hermes Agent | Claude Code |
|---|---|---|---|
| 模型 | stateless | stateful(session_id) | stateful |
| 压缩 | opaque encrypted block | LLM summarizer(可审计) | /compact 命令 |
| 缓存层 | Prompt Caching 自动 | 需手动管理 | Claude API 缓存层 |
| 上下文窗口 | — | 4K-16K | 1M |
| 合规 | ZDR 零数据留存 | 可控 | — |
记忆研究方向
- 记忆分层模型 — 工作记忆/短期/长期的分界阈值
- 存储层设计 — 向量 vs 结构化 vs 混合
- 写入策略 — 提取时机、去重合并
- 检索策略 — 主动预取/按需懒加载/排序加权
- 压缩遗忘 — 层级摘要、时间衰减、间隔重复
- 生命周期 — 分层转移、过期清理
2026-06 论文速览
- MMPO (Meta-Cognitive Memory Policy Optimization) — 提出信念熵(Belief Entropy)作为自监督代理衡量记忆质量,显式惩罚导致高认知不确定性的摘要。在 1.75M token 上下文中保持 97.1% 性能(2605.30159)
- MemTrain — 自监督上下文记忆训练框架,通过端到端掩码重建 + 中间记忆召回双目标联合优化,无下游数据即可提升记忆密集型推理最高 +17.67 分(2606.03197)
- Memory Poisoning Attacks — 首次系统研究 Agent 记忆投毒攻击,揭示从不可信输入到可信记忆的安全漏洞(2606.04329)
- CL-Bench — 持续学习基准发现专用记忆系统在持续学习上反而不如简单 ICL,对记忆系统设计路径有直接冲击(2606.xxxxx)
- MRAgent — 基于图的联想记忆(线索-标签-内容)结合主动重建策略,在 LoCoMo 和 LongMemEval 上提升 23%,同时降低 token 成本(2606.xxxxx)
- TriMem — 三粒度记忆架构:原始对话片段(保真)、原子事实(高效检索)、合成 profile(深度推理),TextGrad 驱动无需参数更新(2605.19952)
- AgingBench — 识别 Agent 四种衰老机制(压缩/干扰/修订/维护),系统研究长期部署中的可靠性衰减(2605.26302)
相关页面:MemorySystem ComplementaryLearningSystem DialecticReasoning Honcho MemorySystem PlasticLabs