分层记忆系统与长期记忆管理

概述

Agent 记忆系统是所有 Agent 能力的底层基础设施。核心挑战：在极长对话（数万轮）中保持高质量响应。解法是分层的记忆系统设计，从工作记忆到长期记忆，配合生命周期管理。

2026-06-07 在 Hermes Agent 上完成的记忆系统重构验证了以下设计：

IDENTITY → PROJECTS → RULES → QUICKREF → PENDING → LESSONS → GROWTH

McClelland, McNaughton & O’Reilly (1995) — 脑科学对记忆系统最重要的贡献之一：

关键机制：模式分离（区分相似经历）vs 模式完成（从部分线索重建完整记忆）。

Provider	存储方式	独特优势	量级
Honcho	PostgreSQL + Dialectic 推理	多 Agent 隔离、双层上下文注入	中等
Hindsight	知识图谱 + 4 策略检索	4 种并行检索策略	中-重
Holographic	SQLite + FTS5/HRR	零外部依赖、矛盾检测	轻量
Mem0	向量搜索 + 图谱	自动记忆管理、SOC 2 合规	中等
RetainDB	混合搜索 + Delta 压缩	LongMemEval SOTA、p95 <40ms	中等
ByteRover	层级知识树	CLI 优先、本地化	轻-中

OpenAI Codex CLI 采用 stateless 三层架构：

层	机制	触发条件
Prompt Caching（主力）	stateless 请求，保证精确前缀	cache miss：换工具/模型/配置/MCP 顺序
自动压缩（兜底）	opaque 压缩块（encrypted_content）	model_auto_compact_token_limit 默认 200K
可调参数	compact_prompt、tool_output_token_limit 等	按需

对比总结：

维度	Codex CLI	Hermes Agent	Claude Code
模型	stateless	stateful（session_id）	stateful
压缩	opaque encrypted block	LLM summarizer（可审计）	/compact 命令
缓存层	Prompt Caching 自动	需手动管理	Claude API 缓存层
上下文窗口	—	4K-16K	1M
合规	ZDR 零数据留存	可控	—

MMPO (Meta-Cognitive Memory Policy Optimization) — 提出信念熵（Belief Entropy）作为自监督代理衡量记忆质量，显式惩罚导致高认知不确定性的摘要。在 1.75M token 上下文中保持 97.1% 性能（2605.30159）
MemTrain — 自监督上下文记忆训练框架，通过端到端掩码重建 + 中间记忆召回双目标联合优化，无下游数据即可提升记忆密集型推理最高 +17.67 分（2606.03197）
Memory Poisoning Attacks — 首次系统研究 Agent 记忆投毒攻击，揭示从不可信输入到可信记忆的安全漏洞（2606.04329）
CL-Bench — 持续学习基准发现专用记忆系统在持续学习上反而不如简单 ICL，对记忆系统设计路径有直接冲击（2606.xxxxx）
MRAgent — 基于图的联想记忆（线索-标签-内容）结合主动重建策略，在 LoCoMo 和 LongMemEval 上提升 23%，同时降低 token 成本（2606.xxxxx）
TriMem — 三粒度记忆架构：原始对话片段（保真）、原子事实（高效检索）、合成 profile（深度推理），TextGrad 驱动无需参数更新（2605.19952）
AgingBench — 识别 Agent 四种衰老机制（压缩/干扰/修订/维护），系统研究长期部署中的可靠性衰减（2605.26302）