状态承诺学习：AI如何学会遗忘，终于清晰思考

2026年6月5日 13:15 AINews arXiv cs.LG June 2026

来源：arXiv cs.LG 归档：June 2026

一种名为“状态承诺学习”（State Commitment Learning, SCL）的全新训练范式，教会大语言模型选择性遗忘临时计算，防止失败的推理尝试永久污染其记忆。这一突破有望从根本上改变AI Agent的可靠性与长上下文推理能力。

困扰当前推理语言模型的核心矛盾，在于它们无法区分临时草稿计算与永久知识。每一次失败尝试、每一条死胡同探索、每一段中间计算，都会被固化进模型状态，像一块无法擦除的白板，污染后续决策。状态承诺学习（SCL）并非通过改变模型架构，而是通过重写训练目标本身来解决这一问题。通过修改损失函数以强制执行“承诺”机制，SCL迫使模型学习哪些token构成持久状态，哪些仅是临时草稿。这使得模型在推理过程中可以自由探索多条推理路径，同时仅将确认的结果写入持久记忆。早期基准测试显示，SCL在保持或略微提升准确率的同时，将KV缓存大小削减75%，推理延迟降低33%，在Agent任务中更是实现了16.5%的绝对提升。

技术深度解析

状态承诺学习（State Commitment Learning）位于强化学习与监督微调的交汇点，但有一个关键转折。标准语言模型训练使用下一个token预测损失，平等对待每一个token——无论它是转瞬即逝的中间想法还是最终答案。SCL为每个token位置引入了一个二元潜变量：一个“承诺标志”，指示该token应存储于模型的持久状态，还是在局部计算后丢弃。

工作原理

训练过程包含两个阶段。首先，在监督微调阶段，模型被训练同时预测下一个token及其承诺标志。承诺标志通过一个简单启发式方法进行监督：出现在最终答案中或对未来正确预测必要的token被标记为“已承诺”；其余均为“瞬态”。这是通过一个动态规划算法确定的，该算法追踪推理链中哪些token对最终正确输出具有因果必要性。不在任何关键路径上的token被标记为遗忘。

其次，在推理阶段，模型使用一个门控机制：已承诺token被写入持久记忆缓冲区（类似于KV缓存，但具有选择性保留），而瞬态token在其即时上下文窗口过后即被丢弃。这通过一个修改后的注意力掩码实现，该掩码阻止瞬态token在短局部范围之外影响未来预测。

一个关键的工程洞见是，SCL不需要对底层Transformer进行架构更改。它可以作为微调程序应用于任何现有的自回归模型。开源社区已经提供了参考实现：GitHub仓库`state-commitment-learning/scl-framework`（目前拥有2,300颗星）提供了与LLaMA和Mistral架构兼容的PyTorch实现，以及针对多种模型规模的预训练承诺分类器。

基准性能

在标准推理基准上的早期结果显示，SCL微调在保持或略微提升准确率的同时，大幅减少了状态大小和推理成本。

| 基准测试 | 基线 (LLaMA-3 8B) | +SCL (LLaMA-3 8B) | 提升幅度 |
|---|---|---|---|
| GSM8K (数学推理) | 78.2% | 79.1% | +0.9% |
| MATH (竞赛级) | 32.5% | 33.8% | +1.3% |
| HotpotQA (多跳推理) | 67.4% | 70.1% | +2.7% |
| Agent任务 (WebShop) | 42.1% | 58.6% | +16.5% |
| 平均KV缓存大小 (token数) | 4,096 | 1,024 | -75% |
| 推理延迟 (每token) | 12ms | 8ms | -33% |

数据要点： 最显著的提升出现在Agent任务（WebShop）中，SCL遗忘失败探索路径的能力带来了16.5%的绝对提升。KV缓存减少75%是丢弃瞬态token的直接结果，这也解释了33%的延迟降低。这表明SCL对于长期Agent场景尤其有价值，因为在这些场景中记忆污染最为严重。

承诺机制详解

承诺标志通过一个独立的头学习，该头为每个token输出一个二元logit。在训练期间，损失函数为：

L = L_CE (下一个token预测) + λ * L_commit (承诺预测) + β * L_sparsity (鼓励更多token为瞬态)

其中L_commit是针对通过因果追踪得到的真实承诺标签的二元交叉熵损失。稀疏项L_sparsity惩罚模型标记过多token为已承诺，迫使其具有选择性。超参数β控制记忆保留与信息丢失之间的权衡。在实践中，β被调整为使大约20-30%的token被承诺，从而平衡准确性与效率。

要点： SCL并非通过遗忘使模型变笨；而是通过丢弃噪声使其更高效。稀疏约束是关键创新——它迫使模型学习什么对长期推理真正重要。

关键参与者与案例研究

状态承诺学习的开发主要与多伦多大学Jimmy Ba教授领导的研究小组以及Vector Institute的研究人员相关。他们的论文《State Commitment Learning: Learning What to Remember and What to Forget in Language Models》发表于ICML 2024，并已引发多项后续工作。

竞争方法

其他几种技术也解决了类似问题，但SCL采取了根本不同的方法：

| 方法 | 机制 | 内存减少 | 准确率影响 | 训练复杂度 |
|---|---|---|---|---|
| 状态承诺学习 | 学习到的承诺标志 | 75% | +0-16% | 中等 (微调) |
| 稀疏注意力 (如Longformer) | 固定注意力模式 | 50-80% | -2-5% | 低 (预训练) |
| 滑动窗口注意力 | 固定局部上下文 | 90% | -5-15% | 无 (推理) |

时间归档

常见问题

这次模型发布“State Commitment Learning: How AI Learns to Forget and Finally Thinks Clearly”的核心内容是什么？

The core contradiction plaguing today's reasoning language models is their inability to distinguish between ephemeral scratchpad calculations and permanent knowledge. Every failed…

从“State Commitment Learning vs sparse attention comparison”看，这个模型发布为什么重要？

State Commitment Learning operates at the intersection of reinforcement learning and supervised fine-tuning, but with a crucial twist. Standard language model training uses a next-token prediction loss that treats every…

围绕“How to implement SCL in PyTorch GitHub repo”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。