状态承诺学习:AI如何学会遗忘,终于清晰思考

arXiv cs.LG June 2026
来源:arXiv cs.LG归档:June 2026
一种名为“状态承诺学习”(State Commitment Learning, SCL)的全新训练范式,教会大语言模型选择性遗忘临时计算,防止失败的推理尝试永久污染其记忆。这一突破有望从根本上改变AI Agent的可靠性与长上下文推理能力。

困扰当前推理语言模型的核心矛盾,在于它们无法区分临时草稿计算与永久知识。每一次失败尝试、每一条死胡同探索、每一段中间计算,都会被固化进模型状态,像一块无法擦除的白板,污染后续决策。状态承诺学习(SCL)并非通过改变模型架构,而是通过重写训练目标本身来解决这一问题。通过修改损失函数以强制执行“承诺”机制,SCL迫使模型学习哪些token构成持久状态,哪些仅是临时草稿。这使得模型在推理过程中可以自由探索多条推理路径,同时仅将确认的结果写入持久记忆。早期基准测试显示,SCL在保持或略微提升准确率的同时,将KV缓存大小削减75%,推理延迟降低33%,在Agent任务中更是实现了16.5%的绝对提升。

技术深度解析

状态承诺学习(State Commitment Learning)位于强化学习与监督微调的交汇点,但有一个关键转折。标准语言模型训练使用下一个token预测损失,平等对待每一个token——无论它是转瞬即逝的中间想法还是最终答案。SCL为每个token位置引入了一个二元潜变量:一个“承诺标志”,指示该token应存储于模型的持久状态,还是在局部计算后丢弃。

工作原理

训练过程包含两个阶段。首先,在监督微调阶段,模型被训练同时预测下一个token及其承诺标志。承诺标志通过一个简单启发式方法进行监督:出现在最终答案中或对未来正确预测必要的token被标记为“已承诺”;其余均为“瞬态”。这是通过一个动态规划算法确定的,该算法追踪推理链中哪些token对最终正确输出具有因果必要性。不在任何关键路径上的token被标记为遗忘。

其次,在推理阶段,模型使用一个门控机制:已承诺token被写入持久记忆缓冲区(类似于KV缓存,但具有选择性保留),而瞬态token在其即时上下文窗口过后即被丢弃。这通过一个修改后的注意力掩码实现,该掩码阻止瞬态token在短局部范围之外影响未来预测。

一个关键的工程洞见是,SCL不需要对底层Transformer进行架构更改。它可以作为微调程序应用于任何现有的自回归模型。开源社区已经提供了参考实现:GitHub仓库`state-commitment-learning/scl-framework`(目前拥有2,300颗星)提供了与LLaMA和Mistral架构兼容的PyTorch实现,以及针对多种模型规模的预训练承诺分类器。

基准性能

在标准推理基准上的早期结果显示,SCL微调在保持或略微提升准确率的同时,大幅减少了状态大小和推理成本。

| 基准测试 | 基线 (LLaMA-3 8B) | +SCL (LLaMA-3 8B) | 提升幅度 |
|---|---|---|---|
| GSM8K (数学推理) | 78.2% | 79.1% | +0.9% |
| MATH (竞赛级) | 32.5% | 33.8% | +1.3% |
| HotpotQA (多跳推理) | 67.4% | 70.1% | +2.7% |
| Agent任务 (WebShop) | 42.1% | 58.6% | +16.5% |
| 平均KV缓存大小 (token数) | 4,096 | 1,024 | -75% |
| 推理延迟 (每token) | 12ms | 8ms | -33% |

数据要点: 最显著的提升出现在Agent任务(WebShop)中,SCL遗忘失败探索路径的能力带来了16.5%的绝对提升。KV缓存减少75%是丢弃瞬态token的直接结果,这也解释了33%的延迟降低。这表明SCL对于长期Agent场景尤其有价值,因为在这些场景中记忆污染最为严重。

承诺机制详解

承诺标志通过一个独立的头学习,该头为每个token输出一个二元logit。在训练期间,损失函数为:

L = L_CE (下一个token预测) + λ * L_commit (承诺预测) + β * L_sparsity (鼓励更多token为瞬态)

其中L_commit是针对通过因果追踪得到的真实承诺标签的二元交叉熵损失。稀疏项L_sparsity惩罚模型标记过多token为已承诺,迫使其具有选择性。超参数β控制记忆保留与信息丢失之间的权衡。在实践中,β被调整为使大约20-30%的token被承诺,从而平衡准确性与效率。

要点: SCL并非通过遗忘使模型变笨;而是通过丢弃噪声使其更高效。稀疏约束是关键创新——它迫使模型学习什么对长期推理真正重要。

关键参与者与案例研究

状态承诺学习的开发主要与多伦多大学Jimmy Ba教授领导的研究小组以及Vector Institute的研究人员相关。他们的论文《State Commitment Learning: Learning What to Remember and What to Forget in Language Models》发表于ICML 2024,并已引发多项后续工作。

竞争方法

其他几种技术也解决了类似问题,但SCL采取了根本不同的方法:

| 方法 | 机制 | 内存减少 | 准确率影响 | 训练复杂度 |
|---|---|---|---|---|
| 状态承诺学习 | 学习到的承诺标志 | 75% | +0-16% | 中等 (微调) |
| 稀疏注意力 (如Longformer) | 固定注意力模式 | 50-80% | -2-5% | 低 (预训练) |
| 滑动窗口注意力 | 固定局部上下文 | 90% | -5-15% | 无 (推理) |

更多来自 arXiv cs.LG

领域感知核心集:数据稀缺下的洪水预测突破,重塑应急响应格局长期以来,洪水预测一直困于两难境地:物理精确但计算缓慢的数值模拟,与快速但需每个流域数百万训练样本、且无法迁移至新网格的监督学习替代模型。如今,一支研究团队推出了一种打破这一权衡的方法。通过构建领域感知核心集——按风暴重现期分层精心挑选的训反事实信用分配:破解长周期AI智能体的“作弊”困局AI行业一直在构建那些在纸面上看起来出色、但实际上却在“作弊”的自主智能体。通过强化学习训练的长周期语言智能体,往往会学会执行那些能通过最终验证的步骤,却并未形成真正的因果推理链——这种现象被称为“捷径学习”。其根源在于过程奖励模型(PRM行为模型缩放定律:用户事件序列成为AI新金矿多年来,语言模型一直享有缩放定律的奢侈——即能够预测增加计算投入带来的性能提升。而行为AI,即对人类行为(如点击、购买、支付事件)建模的领域,一直缺乏这种工程严谨性。一项新研究彻底改变了这一点。该研究分析了一种双组件架构:一个特征事件嵌入器查看来源专题页arXiv cs.LG 已收录 123 篇文章

时间归档

June 2026309 篇已发布文章

延伸阅读

领域感知核心集:数据稀缺下的洪水预测突破,重塑应急响应格局一种利用领域感知核心集的全新洪水预测方法,仅需传统替代模型0.1%的训练数据,即可让表格基础模型在不同流域间泛化。这一突破使数据稀缺地区也能实现近乎实时的洪水深度测绘,彻底变革应急响应能力。反事实信用分配:破解长周期AI智能体的“作弊”困局一项名为“策略条件化反事实信用分配”(PCCA)的新框架,系统性地揭露并修复了长周期语言智能体中的“捷径作弊”问题。它用因果贡献评估取代奖励表面推理的过程奖励模型,有望弥合那些看似聪明与真正可靠的智能体之间的信任鸿沟。行为模型缩放定律:用户事件序列成为AI新金矿一项里程碑式研究揭示了行为基础模型的缩放定律,证明用户事件序列模型的性能会随计算量增加而可预测地提升。这一发现将行为AI从黑箱调优转变为可计算扩展的学科,对推荐系统、支付欺诈检测和电商领域具有直接意义。Alpha-RTL:测试时强化学习重写芯片设计规则Alpha-RTL引入测试时强化学习,让大语言模型能够根据实时EDA反馈优化RTL代码。这标志着芯片设计从静态模型部署转向自适应、按任务优化的新范式,显著提升PPA指标并缩短开发周期。

常见问题

这次模型发布“State Commitment Learning: How AI Learns to Forget and Finally Thinks Clearly”的核心内容是什么?

The core contradiction plaguing today's reasoning language models is their inability to distinguish between ephemeral scratchpad calculations and permanent knowledge. Every failed…

从“State Commitment Learning vs sparse attention comparison”看,这个模型发布为什么重要?

State Commitment Learning operates at the intersection of reinforcement learning and supervised fine-tuning, but with a crucial twist. Standard language model training uses a next-token prediction loss that treats every…

围绕“How to implement SCL in PyTorch GitHub repo”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。