自回归模型的根本性局限

概述

Anthropic 2026.1 论文”The Hot Mess of AI”的核心发现:自回归 Transformer 本质是动力学系统,非优化器——任务链变长时发散(“发疯”)。更大模型更不稳定。

核心发现

  • 自回归模型在长链任务中会产生系统性偏差累积
  • 更大模型更不稳定(参数越多,长链发散概率越高)
  • 这不是 prompt 工程能解决的,是架构层问题

可能解决路径

  1. 非自回归架构 — 并行生成、双向注意力
  2. 世界模型 — 模型内部建立环境表征
  3. 外部验证回路 — 用确定性工具做 check

相关页面:agent-evolution-history self-verification agent-evaluation-framework