Agent 范式演进与关键技术转折
概述
Agent 领域从 2022 到 2026 经历了四波演进:推理增强 → 工具使用 → 自治 Agent → 生态标准化。核心规律是从”思考到行动”、“从个体到生态”、“从实验到工程”。
四波演进
第一波:推理增强 (2022-2023)
- Chain-of-Thought (CoT) — 将复杂问题分解为中间推理步骤
- ReAct (关键转折点) — 推理与行动交错进行,Thought-Action-Observation 循环,是所有后续 Agent 范式的基础
- Tree-of-Thoughts (ToT) — BFS/DFS 搜索多条推理路径
- 范式特征:无外部工具、纯 prompting、静态执行
第二波:工具使用 (2023)
- OpenAI Function Calling — 结构化工具调用 API 成为行业标准
- Reflexion — 通过语言反馈和自我反思迭代改进
- Lilian Weng Agent Framework — 系统提出 Agent 三组件:Planning、Memory、Tool Use
- 范式特征:Thought-Action-Observation 循环、外部知识获取、自我修正
第三波:自治 Agent (2023-2024)
- AutoGPT/BabyAGI — 开创长期自治 Agent 概念,但暴露了不稳定、token 爆炸等问题
- Devin — 首个”AI 软件工程师”
- LangGraph — 图状态机精确控制 Agent 执行流程
- 范式特征:自主循环、长期目标、多 Agent 协作、多模态
第四波:生态标准化 (2024-2026)
- MCP 协议 — 统一 Agent-工具连接标准(“Agent 界的 USB 接口”)
- A2A 协议 — 跨系统 Agent 间通信协议
- SDK 成熟化 — 每个主要 AI 公司都推出了 Agent SDK
- 范式特征:协议标准化、简单优先、人机协作
关键转折点
- ReAct (2022.10) — Agent 范式的”奇点”,首次让 LLM 与外部环境形成闭环
- Function Calling (2023.06) — 从 prompt hack 变成工程化的可靠系统
- 主/工具模型分工 (2024) — 解决 Agent 上下文膨胀的关键方案
- MCP 协议 (2024.11) — 工具集成从点对点变为星型拓扑
- SDK 标准化 (2025-2026) — 竞争转向用户体验和生态
Dead End 教训
| Dead End | 死因 | 核心教训 |
|---|---|---|
| 完全自治 Agent | 不可控、token 爆炸 | 人机协作必须有 guardrail |
| 纯 Prompt 驱动 | 能力天花板 | 模型层能力决定 Agent 上限 |
| 单模型包办 | 上下文膨胀 | 分工优于全能 |
| 无限自我改进 | 收益递减 | 外部验证 > 内部反思 |
| 过度抽象框架 | 调试困难 | 简单可组合 > 复杂抽象 |
框架生态
| 框架 | 设计哲学 | 适用场景 |
|---|---|---|
| LangChain/LangGraph | 组件化、图状态机 | 复杂流程编排 |
| AutoGen | 多 Agent 对话驱动 | 研究/实验 |
| CrewAI | 角色扮演协作 | 多角色任务 |
| OpenAI Agents SDK | 简洁、模型优先 | 快速原型 |
| Claude Agent SDK | 安全、MCP 原生 | 企业级 Agent |
| Google ADK | 生态系统连接 | Google Cloud 集成 |
| Hermes Agent | 主/工具模型分工 | 个人/开发者 Agent |
相关页面:ReAct FunctionCalling MCP A2A MainToolModelDivision DeadEndPattern Anthropic NousResearch