课题一:Agent 范式演进与关键技术转折
优先级:P1 — 所有课题的共同基础
当前状态
✅ 系统性梳理完成(2026-05-30)
产出三份文档:
| 文档 | 说明 |
|---|---|
| 演进时间线 | 2022→2026 四波演进(推理增强→工具使用→自治Agent→生态标准化),5个关键技术转折点深度分析,Hermes Agent 在演进图谱中的定位 |
| 框架比较矩阵 | 13 个主流框架(LangChain、AutoGen、CrewAI、LangGraph、OpenAI SDK、Claude SDK、Google ADK、Hermes Agent 等)在架构哲学、功能矩阵、工具生态、通信模式、使用场景上的系统对比 |
| Dead End 分析 | 7 个已被验证的 dead end 方向(完全自治 Agent、纯 Prompt 驱动、单模型包办、无限自我改进、过度抽象框架、缺乏标准评估、自定义协议),含死因分析、教训提炼、对 interview-app 的具体启示 |
已覆盖的研究方向
- 范式演进时间线 — 从 CoT (2022) 到 SDK 标准化 (2026) 的完整脉络
- 关键技术转折点 — ReAct、Function Calling、主/工具模型分工、MCP 协议、SDK 标准化
- Dead End 方向盘点 — 7 个方向的失败原因与教训
- 框架设计哲学对比 — 13 个框架的架构模式、设计理念、工具生态
- Hermes Agent 定位 — 在演进图谱中位于”单 Agent”分支,核心差异在主/工具模型分工和 MCP 原生支持
- 对 interview-app 的启示 — 6 条具体设计原则(人机协作、主/工具分工、结构化评估等)
当前层
Layer 1 (认知层) → 系统性梳理已完成,进入 Gate 1 待评估。
Gate 1 检查清单:
- 知道研究的问题是什么 — Agent 范式如何演进,关键转折点在哪
- 知道有谁在做类似的事 — 13 个框架系统对比完成
- 知道技术上大致可行 — 演进规律和趋势已提炼
- 判断这个方向值得投入时间 — 需要你来判断
核心发现
- ReAct 是 Agent 范式的”奇点” — 今天所有 Agent 本质都是 ReAct 的变体或扩展
- 四波演进:思考(2022)→ 行动(2023)→ 自治(2023-2024)→ 标准化(2024-2026)
- 死因共性:所有 dead end 都源于”过于乐观的假设”——高估模型的推理能力,低估结构化和工程化的重要性
- Hermes 的独特位置:主/工具模型分工是 Hermes 独有的架构选择,也是解决 Agent 上下文膨胀的关键方案
- 趋势:协议标准化(MCP/A2A)正在消除框架间差异,竞争转向用户体验和生态
下一步建议
- 如果确认此课题价值已挖掘充分 → 进入 课题二(跨Session上下文)
- 如果有想深入的子方向 → 可展开(如 MCP vs A2A 协议细节对比)
关联课题
- 课题二(跨 Session 上下文) — 上下文管理是 Agent 长时运行的刚需
- 课题十三(推理成本优化) — Agent 的 token 消耗与延迟直接影响用户体验
- 课题十五(双系统推理) — ReAct 本质上是 System 1 + System 2 的混合
实践参考
-
Agent 架构参考项目索引 — 从零构建 Agent 时的参考项目清单(Smolagents/Aider/SWE-Agent/Claude Code 等),含分析维度和阅读优先级
-
课题三:分层记忆系统与长期记忆管理
-
课题五:主模型推理与工具模型执行分工
参考资料
- Lilian Weng: LLM Powered Autonomous Agents
- Agent 领域综述论文 (Xi et al., Wang et al.)
- Google: Agents 白皮书
- Anthropic: Building Effective Agents (2024.12)
- MCP Protocol / A2A Protocol 官方文档
- 各大框架官方文档