人机协作与渐进式自主

概述

Agent 的最终形态不是替代人,而是与人协作。核心问题是设计自主度分级模型,让 Agent 在合适的边界内自主,在需要时与人协作。

自主度分级模型

级别模式说明
L0完全被动执行用户每一步指令
L1建议模式Agent 建议,用户确认后执行
L2半自主常规操作自主,高风险操作确认
L3条件自主预设边界内完全自主,越界升级给人
L4完全自主仅关键里程碑同步

研究方向

  1. 自主度动态调整 — 基于历史成功率自动升降级
  2. 干预接口 — 用户随时打断、纠错、回退
  3. 信任建立 — 主动标”不确定”、引用来源、一致性维护、渐进授权
  4. 降级策略 — API 故障/超能力时优雅降级 | 异常检测→强制人工接管

个人开发者多 Agent 协作

基于 Claude Code + Hermes Agent 的实际协作分工:

  • 用户 — 最终决策层
  • 克劳德(Claude Code) — 工匠(调研→设计→编码→测试,只执行不决策)
  • 大锤(Hermes) — 大管家(流程协调→质量把关→文档沉淀→运维执行)

相关页面:agent-safety-boundary agent-explainability-debugging agent-evaluation-framework ai-society-impact