论文日报 综合 — 2026-06 上旬

来源目录:raw/chatlogs/paper-daily/(7 期:6 月 1 日、3 日、4 日、5 日、6 日、7 日、8 日)

覆盖 7 期论文日报,每期从 HuggingFace Daily Papers 和 arXiv cs.AI 新投稿中筛选 AI Agent 方向论文。共计筛选数百篇论文,覆盖 26+ 个研究课题。核心趋势包括:(1) Agent 记忆系统爆发——MMPO 信念熵、MemTrain 自监督训练、图记忆架构、CL-Bench 对专用记忆系统的质疑等多方向并行推进;(2) Agent 安全进入精细化阶段——后验攻击悖论、SABER >54% 违规率、BraveGuard 自演进防御、SPADE-Bench 欺骗检测等构成多层防线;(3) 自我演进从概念走向系统——MUSE-Autoskill 完整闭环、SkillGrad 梯度式优化、经验内化中的能力崩溃诊断、SePO 自引用优化;(4) 评估从结果转向过程——DRIFT 跨度级错误定位、RAMP 复活协议、ALE 综合评测仅 2.6% 通过率;(5) 多 Agent 通信效率突破——StreamMA 流式通信 26.9× 加速、PACT 协议化通信 token 减半、BenchAgent 揭示多 Agent 并非总是更好;(6) 复杂规划与工具学习深化——AdaPlanBench 双重约束、DiG-Plan 扩散规划、AutoLab 揭示持久性关键、MMG2Skill 指南到技能闭环、TAPO 信用错配诊断。