Agent 范式演进时间线

课题一:Agent 范式演进与关键技术转折 分层:Layer 1 | 元认知与认知框架 状态:系统性梳理完成 最后更新:2026-05-30


总览:Agent 范式的四波演进

2022 ──────────────────────────────────────────────────── 2026 →
       │               │               │               │
   第一波             第二波           第三波           第四波
   Prompting          工具使用         自治Agent       生态标准化
   ────────          ──────────      ──────────      ──────────
   CoT (2022)        ReAct (2023)    AutoGPT (2023)   MCP (2024.11)
   ToT (2023)        Toolformer      BabyAGI          A2A (2025.04)
   GoT (2023)        ART (2023)      AgentGPT         Agents SDKs
   CoVe (2023)       ReWoo (2023)    GPT-Engineer     ADK (2025)
                     Func Calling    Devin (2024)     Hermes Agent
                     RAG             Claude Code      ...
                     Reflexion       Manus (2025)

第一波:推理增强与思维范式 (2022-2023)

核心问题:如何让 LLM 更好地”思考”?

里程碑

时间技术贡献者核心思想
2022.01Chain-of-Thought (CoT)Wei et al. (Google)“Let’s think step by step” — 将复杂问题分解为中间推理步骤
2022.05Self-ConsistencyWang et al. (Google)多次采样 CoT 结果,取多数投票,提升推理鲁棒性
2022.10ReActYao et al. (Google/Princeton)关键转折点 — 推理(Reasoning)与行动(Acting)交错进行,Thought-Action-Observation 循环
2023.03Tree-of-Thoughts (ToT)Yao et al. (Princeton/Google)BFS/DFS 搜索多条推理路径,自评估剪枝
2023.05Chain-of-Verification (CoVe)Meta AI生成→验证→修正,减少幻觉的四步法
2023.08Graph-of-Thoughts (GoT)G. Besta et al. (ETH)有向图结构建模推理过程,支持合并、循环等操作

范式特征

  • 无外部工具:完全依赖 LLM 自身的推理能力
  • 思维建模:关注如何组织 LLM 的”思考过程”
  • 纯 Prompting:不改变模型结构,通过 prompt 工程实现
  • 静态执行:一次推理生成完整响应,无外部交互

关键洞察

CoT → ToT → GoT 的演进体现了从线性思维向图结构思维的扩展。但从 ReAct 开始,范式发生了根本性转变——LLM 不再只是一个”思考者”,而是开始与环境交互。


第二波:工具使用与行动循环 (2023)

核心问题:如何让 LLM 与外部世界交互?

里程碑

时间技术贡献者核心思想
2023.02ToolformerSchick et al. (Meta)自监督学习工具调用(API、计算器、搜索等)
2023.05ART (Automatic Reasoning & Tool-use)Paranjape et al. (AI2)自动构建推理-工具使用程序库
2023.06ReWoo (Reasoning WithOut Observation)Xu et al. (KFAIR)先规划再执行,将 ReAct 的观察延迟到推理完成后
2023.06Lilian Weng Agent FrameworkOpenAI系统提出 Agent 三组件:Planning、Memory、Tool Use
2023.07OpenAI Function CallingOpenAI官方结构化工具调用 API,成为行业标准
2023.09ReflexionShinn et al. (Northeastern)通过语言反馈和自我反思迭代改进
2023.10RAG 范式的成熟multipleRetrieval-Augmented Generation 从概念成为 Agent 标配
2023.11GPTs + ActionsOpenAI允许用户创建自定义 Agent 并调用外部 API

范式特征

  • Thought-Action-Observation 循环:ReAct 开创的标准模式
  • 外部知识获取:RAG、搜索 API
  • 工具调用能力:Function Calling 成为模型原生能力
  • 自我修正:Reflexion 引入反思机制

关键转折点对比

对比维度ReActReWooReflexion
推理时机交错(边想边做)先规划后执行执行后反思
错误处理隐式(靠下轮纠正)规划时预防显式反思修正
适用场景需要即时反馈的任务需全局规划的任务可多次尝试的任务
效率灵活但 token 开销大减少冗余观察增加反思轮次

第三波:自治Agent与实验狂潮 (2023-2024)

核心问题:LLM 能否自主完成端到端任务?

里程碑

时间项目类型核心思想
2023.03AutoGPT开源项目长期自治的目标驱动 Agent,循环自我提示
2023.04BabyAGI开源项目任务驱动的自治 Agent,动态任务队列+完成检查
2023.04AgentGPT开源项目Web 界面版的 AutoGPT
2023.05GPT-Engineer开源项目代码生成Agent:需求 → 技术spec → 编码
2023.09Superagent开源项目可配置的 Agent 框架,支持多种 LLM
2023.10LangChain Agent框架首个主流 Agent 框架,ReAct 模式标准化
2023.10AutoGenMicrosoft多 Agent 对话框架,Agent 间协作范式
2023.11CrewAI开源角色扮演式多 Agent,Task → Agent → Crew 三层
2024.01MetaGPT开源模拟软件公司角色的多 Agent 协作
2024.03Devin商业产品Cognition AI — 首个”AI 软件工程师”
2024.03Claude Code商业产品Anthropic — 终端内 AI 编码助理
2024.05GPT-4o模型发布原生的多模态 Agent 能力(看/听/说)
2024.06OpenAI Agents SDK框架OpenAI 官方 Agent 工具包
2024.07LangGraph框架LangChain 的图状态 Agent 框架
2024.09Claude Computer UseAPI 功能Agent 可直接操作桌面/浏览器
2024.11Computer Use Agent产品Anthropic — 屏幕视觉理解+点击操作

范式特征

  • 自主循环:Agent 不再需要人类每个步骤的输入
  • 长期目标:多步骤、多工具调用完成复杂目标
  • 自我优化:反思 + 记忆 + 计划迭代
  • 多Agent协作:Agent 间有角色分工与通信
  • 多模态:视觉、音频输入成为 Agent 能力

实验狂潮中的关键教训

  1. AutoGPT 的过热与退潮

    • 开创了”长期自治 Agent”概念
    • 痛点:不稳定、token 爆炸、缺少结构化控制
    • 启示:纯自治(无人工监督)在真实场景中不实用
  2. Devin 的定位争议

    • 首个 AI 软件工程师,引起轰动
    • 现实:在复杂任务上仍然频繁出错
    • 启示:Agent 需要适当的评估标准和期望管理

Dead End 方向盘点

方向探索者死因教训
完全自治 AgentAutoGPT 早期不稳定、token 爆炸需要人机协作的 guardrail
纯 Prompt 驱动 Agent(无 fine-tune)早期尝试能力天花板明显模型级 Agent 能力更重要
单一模型包办所有 Agent 任务2023 主流各环节需求矛盾主/工具模型分工
无限循环自主改进部分实验不可控+幻觉累积需要终止条件和验证

第四波:生态标准化与工程成熟 (2024-2026)

核心问题:如何让 Agent 在真实世界中可靠、可组合、可维护?

里程碑

时间事件类型核心意义
2024.11MCP Protocol协议标准Anthropic 推出 Model Context Protocol — 统一 Agent-工具连接标准
2024.12Anthropic “Building Effective Agents”思想指导明确提出”Workflows vs Agents”二分法,倡导简单模式
2025.03Google A2A Protocol协议标准Agent-to-Agent 通信协议,跨系统 Agent 协作
2025.03OpenAI Agents SDKSDK官方 Agent 构建工具包,简化开发流程
2025.04Manus产品通用 Agent 产品,展示 Agent 实用性
2025.05Claude Agent SDKSDKAnthropic 官方 Agent SDK
2025.06Hermes Agent框架Nous Research — 全栈 AI Agent 框架(我们的工具)
2025.08AWS Strands Agents SDKSDKAWS 云原生 Agent SDK
2025.09Google ADKSDKGoogle 官方 Agent Development Kit
2025.10Codex CLI工具OpenAI — 终端原生编码 Agent
2026.01Gemma 4 系列模型Google 开源模型强化 Agent 能力
2026.05现状:大量 SDK 涌现生态行业从”能否构建”转向”如何标准化”

范式特征

  • 协议标准化:MCP(工具连接)、A2A(Agent间通信)
  • SDK 成熟化:每个主要 AI 公司都推出 Agent SDK
  • 简单优先:Anthropic 倡导先从简单 workflow 开始
  • Workflow vs Agent:明确区分确定性流程和自主决策
  • 人机协作:Agent 不是取代人,而是增强人

Workflows vs Agents(Anthropic 2024.12 定义)

Workflows                            Agents
─────────                          ──────────
预定义的确定性流程                   LLM 自主决策
适合明确可分解的任务                 适合需要灵活性的场景
可预测、易调试                      不可预测、需监控
例子:Prompt Chaining             例子:自治客服机器人
   Routing                         代码 Agent
   Parallelization                 研究 Agent
   Orchestrator-Workers            Devin
   Evaluator-Optimizer

关键转折点深度分析

转折点 1:ReAct (2022.10)

之前                          之后
──────────                   ──────────
LLM 作为"生成器"             LLM 作为"决策者"
单轮输入 → 输出              Thought → Action → Observation 循环
无外部状态                   内部推理 + 外部观测

影响:ReAct 是 Agent 范式的”奇点”——它第一次让 LLM 与外部环境形成闭环。今天所有 Agent(从 AutoGPT 到 Claude Code)的本质都是 ReAct 的变体或扩展。

转折点 2:Function Calling (2023.06)

之前                          之后
──────────                   ──────────
模型输出自然语言描述工具调用      模型输出结构化 JSON 调用
需外部解析器提取意图             调用参数严格类型化
容易解析失败                     可靠函数签名

影响:Function Calling 让 Agent 从”prompt hack”变成了工程化的可靠系统。没有它,MCP、Agent SDK 等上层生态都无法建立。

转折点 3:Agent 分工 — 主/工具模型 (2024)

之前                          之后
──────────                   ──────────
一个模型完成所有 Agent 工作      规划模型 + 执行模型分离
上下文被工具输出撑爆             工具模型运行在隔离环境
推理能力被工具调用稀释           主模型专注推理决策

影响:Hermes Agent 就是这种分工的代表作——主模型(agent model)负责规划和决策,工具模型(tool-use model)负责具体的工具执行和结果处理。

转折点 4:MCP 协议 (2024.11)

之前                          之后
──────────                   ──────────
每个工具需自定义集成             统一协议连接所有工具
n 个工具需 n 个适配器            一个 MCP 客户端连接任意 MCP 服务器
工具变更需重写 Agent 代码        服务器独立演进,客户端自动适配

影响:MCP 是 Agent 生态的”USB 接口”——它让工具集成从点对点变为星型拓扑,是 Agent 从实验走向工程化的关键基础设施。

转折点 5:SDK 标准化 (2025-2026)

SDK公司特点适用场景
OpenAI Agents SDKOpenAI简洁、与 GPT 系列深度集成快速原型、GPT 生态
Claude Agent SDKAnthropicMCP 原生支持、安全优先企业级 Agent
Google ADKGoogleA2A 协议、Gemini 生态Google Cloud 用户
LangChain/LangGraph社区最成熟的 Agent 框架灵活定制、多模型
CrewAI社区角色扮演多 Agent 协作多角色任务
AutoGenMicrosoft多 Agent 对话研究实验
Hermes AgentNous Research全栈 Agent 框架个人/开发者 Agent
Strands Agents SDKAWS云原生AWS 生态企业

Hermes Agent 在演进图谱中的位置

                          Agent 范式演进树
     ────────────────────────────────────────────
                            │
                    ┌───────┴───────┐
                    │               │
               Workflow          Agent
                    │               │
              Prompt Chain     ReAct 范式
              Routing          ├──────────
              Parallelization  │
                               │
                     ┌─────────┼─────────┐
                     │         │         │
                 单 Agent    多 Agent    嵌入 Agent
                     │         │         │
               Hermes Agent  AutoGen  Function Call
               Claude Code   CrewAI   OpenAI GPTs
               Devin         MetaGPT
               Manus

Hermes Agent 的定位:位于”单 Agent”分支,但支持工具模型分工、MCP 工具集成、可编程 skill 系统、多 Session 上下文共享等高级特性。相比 Claude Code/Devin 侧重编码场景,Hermes Agent 是一个通用的 Agent 框架。

核心架构贡献

  1. 主/工具模型架构:agent model + tool-use model 分工
  2. Skill 系统:可组合的领域知识模块
  3. Kanban 协作:多 Agent 的异步任务编排
  4. MCP 原生支持:开放工具生态
  5. 记忆系统:跨 Session 上下文持久化

范式演进总结

2022               2023               2024               2025               2026
──                ──                ──                ──                ──
CoT               ReAct ★           AutoGPT           MCP ★             SDK 标准化
                  Function Call ★   Devin             A2A               Agent 工程化
                  Toolformer        Multi-Agent       Manus             共识形成
                  Reflexion         LangGraph         Claude Code
                  ──                ──                ──
                  "能思考"           "能自治"          "能标准化"
                  思考+行动         长期自主           生态互联
                  工具使用           自我优化           人机协作

核心演进规律

  1. 从思考到行动:ReAct 让 LLM 从”想”变成”想+做”
  2. 从个体到生态:单 Agent → 多 Agent → 协议标准化
  3. 从实验到工程:AutoGPT 的疯狂 → Anthropic 的”简单优先”
  4. 从黑箱到透明:End-to-end Agent → 可分解、可调试的 Workflow
  5. 模型能力的流水线化:单一全能模型 → 主模型+工具模型+验证模型

本文档为 interview-app 项目面试准备材料 相关课题:课题二(跨Session上下文)、课题三(分层记忆系统)、课题五(主/工具模型分工)