人机协作与渐进式自主

概述

Agent 的最终形态不是替代人，而是与人协作。核心问题是设计自主度分级模型，让 Agent 在合适的边界内自主，在需要时与人协作。

自主度分级模型

级别	模式	说明
L0	完全被动	执行用户每一步指令
L1	建议模式	Agent 建议，用户确认后执行
L2	半自主	常规操作自主，高风险操作确认
L3	条件自主	预设边界内完全自主，越界升级给人
L4	完全自主	仅关键里程碑同步

研究方向

自主度动态调整 — 基于历史成功率自动升降级
干预接口 — 用户随时打断、纠错、回退
信任建立 — 主动标”不确定”、引用来源、一致性维护、渐进授权
降级策略 — API 故障/超能力时优雅降级 | 异常检测→强制人工接管

个人开发者多 Agent 协作

基于 Claude Code + Hermes Agent 的实际协作分工：

用户 — 最终决策层
克劳德（Claude Code） — 工匠（调研→设计→编码→测试，只执行不决策）
大锤（Hermes） — 大管家（流程协调→质量把关→文档沉淀→运维执行）

相关页面：agent-safety-boundary agent-explainability-debugging agent-evaluation-framework ai-society-impact