人机协作与渐进式自主
概述
Agent 的最终形态不是替代人,而是与人协作。核心问题是设计自主度分级模型,让 Agent 在合适的边界内自主,在需要时与人协作。
自主度分级模型
| 级别 | 模式 | 说明 |
|---|---|---|
| L0 | 完全被动 | 执行用户每一步指令 |
| L1 | 建议模式 | Agent 建议,用户确认后执行 |
| L2 | 半自主 | 常规操作自主,高风险操作确认 |
| L3 | 条件自主 | 预设边界内完全自主,越界升级给人 |
| L4 | 完全自主 | 仅关键里程碑同步 |
研究方向
- 自主度动态调整 — 基于历史成功率自动升降级
- 干预接口 — 用户随时打断、纠错、回退
- 信任建立 — 主动标”不确定”、引用来源、一致性维护、渐进授权
- 降级策略 — API 故障/超能力时优雅降级 | 异常检测→强制人工接管
个人开发者多 Agent 协作
基于 Claude Code + Hermes Agent 的实际协作分工:
- 用户 — 最终决策层
- 克劳德(Claude Code) — 工匠(调研→设计→编码→测试,只执行不决策)
- 大锤(Hermes) — 大管家(流程协调→质量把关→文档沉淀→运维执行)
相关页面:agent-safety-boundary agent-explainability-debugging agent-evaluation-framework ai-society-impact