多 Agent 协作与通信协议

概述

GenericAgent 目前是单 Agent 架构,interview-app 需要多 Agent 协作(出题→作答→评估→反馈)。核心矛盾:MCP 已成熟 vs A2A 尚未稳定。

协作模式

场景推荐模式
面试题生成主从编排(Orchestrator 拆知识点→出题→组合)
多维度反馈广播并行(多个 Agent 独立评估取综合)
实时对话面试对等协商+主从

通信协议策略

  • MCP(立即接入) — 成熟 v1.0+,9 个原子工具直接封装
  • A2A(观望) — Google 标准,待 v1.0+ 后评估
  • 短期 — 自研轻量消息队列(Redis Pub/Sub 或内存通道)

延迟预算

场景目标延迟超时阈值
实时面试<500ms5s
出题生成<2s15s
评估打分<1s10s

容错策略

四层超时体系:L1 工具(1s)→L2 Agent(3s)→L3 任务(5s)→L4 会话(30s)

核心模式:降级链、熔断器、背压

多方评审协作模式

Hermes 时间注入 PR 实战验证的多方评审流程:

  1. 方案评审 — LLM 方案评审(老克审方案)
  2. 代码评审 — 改到零问题才提 PR
  3. CI 验证 — 确保 CI/CD 管道正常
  4. 维护者评审 — 关联已有 issue,提高接受概率

评审检查清单(补充盲区):

  • 测试覆盖(外部 PR 最看重)
  • 错误处理和降级方案
  • 类型安全和静态分析
  • 向后兼容性
  • 代理/网络配置预设

推荐分工

Orchestrator → 出题 Agent → 评估 Agent → 反馈 Agent → 知识 Agent
       └────────────── MCP 工具层 ────────────────────┘

2026-06 论文速览

  • StreamMA — 流式通信协议用于多 Agent 推理,将推理步骤实时流式传输给下游 Agent(流水线化)。在 8 个推理基准上平均 +7.3 pp,发现步级缩放定律,A=S=64 时 26.9× 加速(2606.05158)
  • PACT (Protocolized Action-state Communication) — 将 Agent 间通信视为公共状态更新问题,用紧凑动作-状态记录代替自由文本。OpenHands 上 -10% token 提升解决率,SWE-agent token 减半性能不降(2606.05304)
  • Do More Agents Help? (BenchAgent) — 统一框架比较单 Agent、固定 MAS 和进化 MAS,在 10 个基准上系统性揭示多 Agent 并非总优于单 Agent,5/6 MAS 工作流落后单 Agent 基线 2.56-11.29 分(2606.05670)
  • CollabBench — 协作游戏基准评估 LLM 协作能力,训练后协作效率提升 19.5%,填补合作环境评测空白(2606.05793)
  • SMAC-Talk — 将星际争霸多智能体挑战扩展为自然语言版本,测试 LLM 多 Agent 协作的经典环境(2606.04202)
  • Strabo — 声明式 Agent 交互协议规范,直接定义多 Agent 通信标准,可与 MCP/A2A 互补(2606.05043)
  • Dynamic Coordination Strategy Selection — 企业多 Agent 系统的动态协调策略选择,从实验室走向工程化的实用工作(2606.xxxxx)

相关页面:agent-protocols agent-harness-engineering agent-safety-boundary agent-memory-system