多 Agent 协作与通信协议

概述

GenericAgent 目前是单 Agent 架构，interview-app 需要多 Agent 协作（出题→作答→评估→反馈）。核心矛盾：MCP 已成熟 vs A2A 尚未稳定。

四层超时体系：L1 工具(1s)→L2 Agent(3s)→L3 任务(5s)→L4 会话(30s)

核心模式：降级链、熔断器、背压

Hermes 时间注入 PR 实战验证的多方评审流程：

评审检查清单（补充盲区）：

Orchestrator → 出题 Agent → 评估 Agent → 反馈 Agent → 知识 Agent
       └────────────── MCP 工具层 ────────────────────┘

StreamMA — 流式通信协议用于多 Agent 推理，将推理步骤实时流式传输给下游 Agent（流水线化）。在 8 个推理基准上平均 +7.3 pp，发现步级缩放定律，A=S=64 时 26.9× 加速（2606.05158）
PACT (Protocolized Action-state Communication) — 将 Agent 间通信视为公共状态更新问题，用紧凑动作-状态记录代替自由文本。OpenHands 上 -10% token 提升解决率，SWE-agent token 减半性能不降（2606.05304）
Do More Agents Help? (BenchAgent) — 统一框架比较单 Agent、固定 MAS 和进化 MAS，在 10 个基准上系统性揭示多 Agent 并非总优于单 Agent，5/6 MAS 工作流落后单 Agent 基线 2.56-11.29 分（2606.05670）
CollabBench — 协作游戏基准评估 LLM 协作能力，训练后协作效率提升 19.5%，填补合作环境评测空白（2606.05793）
SMAC-Talk — 将星际争霸多智能体挑战扩展为自然语言版本，测试 LLM 多 Agent 协作的经典环境（2606.04202）
Strabo — 声明式 Agent 交互协议规范，直接定义多 Agent 通信标准，可与 MCP/A2A 互补（2606.05043）
Dynamic Coordination Strategy Selection — 企业多 Agent 系统的动态协调策略选择，从实验室走向工程化的实用工作（2606.xxxxx）