多 Agent 协作与通信协议
概述
GenericAgent 目前是单 Agent 架构,interview-app 需要多 Agent 协作(出题→作答→评估→反馈)。核心矛盾:MCP 已成熟 vs A2A 尚未稳定。
协作模式
| 场景 | 推荐模式 |
|---|---|
| 面试题生成 | 主从编排(Orchestrator 拆知识点→出题→组合) |
| 多维度反馈 | 广播并行(多个 Agent 独立评估取综合) |
| 实时对话面试 | 对等协商+主从 |
通信协议策略
- MCP(立即接入) — 成熟 v1.0+,9 个原子工具直接封装
- A2A(观望) — Google 标准,待 v1.0+ 后评估
- 短期 — 自研轻量消息队列(Redis Pub/Sub 或内存通道)
延迟预算
| 场景 | 目标延迟 | 超时阈值 |
|---|---|---|
| 实时面试 | <500ms | 5s |
| 出题生成 | <2s | 15s |
| 评估打分 | <1s | 10s |
容错策略
四层超时体系:L1 工具(1s)→L2 Agent(3s)→L3 任务(5s)→L4 会话(30s)
核心模式:降级链、熔断器、背压
多方评审协作模式
Hermes 时间注入 PR 实战验证的多方评审流程:
- 方案评审 — LLM 方案评审(老克审方案)
- 代码评审 — 改到零问题才提 PR
- CI 验证 — 确保 CI/CD 管道正常
- 维护者评审 — 关联已有 issue,提高接受概率
评审检查清单(补充盲区):
- 测试覆盖(外部 PR 最看重)
- 错误处理和降级方案
- 类型安全和静态分析
- 向后兼容性
- 代理/网络配置预设
推荐分工
Orchestrator → 出题 Agent → 评估 Agent → 反馈 Agent → 知识 Agent
└────────────── MCP 工具层 ────────────────────┘
2026-06 论文速览
- StreamMA — 流式通信协议用于多 Agent 推理,将推理步骤实时流式传输给下游 Agent(流水线化)。在 8 个推理基准上平均 +7.3 pp,发现步级缩放定律,A=S=64 时 26.9× 加速(2606.05158)
- PACT (Protocolized Action-state Communication) — 将 Agent 间通信视为公共状态更新问题,用紧凑动作-状态记录代替自由文本。OpenHands 上 -10% token 提升解决率,SWE-agent token 减半性能不降(2606.05304)
- Do More Agents Help? (BenchAgent) — 统一框架比较单 Agent、固定 MAS 和进化 MAS,在 10 个基准上系统性揭示多 Agent 并非总优于单 Agent,5/6 MAS 工作流落后单 Agent 基线 2.56-11.29 分(2606.05670)
- CollabBench — 协作游戏基准评估 LLM 协作能力,训练后协作效率提升 19.5%,填补合作环境评测空白(2606.05793)
- SMAC-Talk — 将星际争霸多智能体挑战扩展为自然语言版本,测试 LLM 多 Agent 协作的经典环境(2606.04202)
- Strabo — 声明式 Agent 交互协议规范,直接定义多 Agent 通信标准,可与 MCP/A2A 互补(2606.05043)
- Dynamic Coordination Strategy Selection — 企业多 Agent 系统的动态协调策略选择,从实验室走向工程化的实用工作(2606.xxxxx)
相关页面:agent-protocols agent-harness-engineering agent-safety-boundary agent-memory-system