课题二十七:Skill 生命周期治理

Agent Skill 的创建→使用→归档→防重建→合并的全生命周期管理

优先级:P2 — 随 skill 数量增长(当前 50+),缺乏治理会阻碍复用

当前情况

  • Hermes Agent 已内置 Curator 系统:stale_after_days=30 归档,archive_after_days=90 删除,interval_hours=168(每周)
  • Curator 已有自动合并能力(如 ollama 系列 5 个 skill → 合并为 1 个)
  • hermes skills pin 支持锁定关键 skill 不被清理
  • ✅ 2026-06-07 讨论记录:确定两条补充规则——
    1. 新创建 skill 14 天空闲→归档(非删除)
    2. 创建时检查 .archive/ 目录,如有相似 skill 提示恢复而非新建
  • ⏳ 待验证:Curator interval 从 7 天缩到 5 天是否更合理

可探索方向

  • 相似 skill 检测算法:基于 name/description 的语义匹配,而非精确同名
  • 创建前检查:skill_manage(create) 时自动搜索已有 skill 是否可合并
  • Skill 健康度指标:use_count / view_count / patch_count 之外,还需 token 注入占比
  • 归档 skill 的温恢复:从 .archive/ 恢复时保留历史 version 记录
  • 跨 profile skill 同步:多个 Hermes profile 之间如何共享/隔离 skill

🆕 2026-06-14 新增参考:SkillOpt — 微软研究院的 Skill 自动优化框架

项目: SkillOpt(MIT 开源) 论文: SkillOpt: Executive Strategy for Self-Evolving Agent Skills

核心思想: 把 skill 的 .md 文件当作”可训练参数”,用类似深度学习的方式(epoch、batch size、validation gate)自动优化 skill 内容。产出 best_skill.md(300-2000 tokens),不碰模型权重。

训练流程: rollout(跑任务)→ reflect(反思结果)→ aggregate(汇总)→ select(选最优)→ update(改 skill 文本)→ evaluate(验证门控)

关键设计:

  • 优化器 LLM 对 skill 文本做 add/delete/replace 编辑
  • 验证门控(held-out validation score 必须提升才接受候选)
  • rejected-edit buffer 防止震荡
  • 跨模型可迁移(一个 skill 在 GPT/Claude/Codex 间共用)

效果: 52 个测试组合全部最佳/并列最佳,GPT-5.5 提分 +23.5(直接对话)/ +24.8(Codex)/ +19.1(Claude Code)

SkillOpt-Sleep(离线巩固): 给 coding agent 加”睡眠周期”——晚上离线回顾 session、重放任务、验证门控后巩固记忆和 skill。支持 Claude Code、Codex、Copilot 插件。

对我们 Hermes 的启发:

  • 验证门控 → 我们的”改完必须验证”原则可以形式化
  • SkillOpt-Sleep 的离线巩固 → 跟 MEMORY/PENDING/LESSONS 定期维护思路一致
  • skill 作为可优化文本 → 我们的 skill 也可以用类似方法自动改进

位置: ~/DEV/ext/SkillOpt/(已克隆,codegraph 已索引)

背景

Hermes Agent 当前有 50+ skill(含 bundled + 用户创建 + agent 创建),且随使用持续增长。没有治理机制会导致 skill 膨胀、内容重复、agent 在 skill 列表中找不到正确的那个。

Curator 已经解决了”废弃 skill 自动清理”的问题,但”创建前防重复”和”归档后防重建”两个缺口需要补充。

关联课题

参考资料