几何冲突揭秘:大模型为何遗忘,可控性如何成为现实

Hacker News May 2026
来源:Hacker News归档:May 2026
一项新研究揭示了大型语言模型在持续后训练中发生灾难性遗忘的根本原因:表征空间中的几何冲突。通过分析微调过程中特征嵌入的扭曲方式,研究人员开发出一种可控方法,能在更新特定能力的同时选择性保留核心知识。这标志着该领域从经验性补丁迈向了理论驱动的精准干预。

多年来,大型语言模型(LLM)的灾难性遗忘一直是一个经验性的黑箱。从业者依赖数据回放、正则化或架构调整来缓解微调过程中先前学习知识的丢失。一项新研究通过提供几何解释改变了这一局面:当模型学习新任务时,内部特征嵌入空间会发生可预测的结构性扭曲。旧知识与新知识的表征方向相互碰撞,将旧能力挤出有效区域。关键在于,这种几何冲突并非随机——它遵循一种可以被主动控制的模式。研究人员提出了一种方法,不是简单地抑制遗忘,而是实现选择性遗忘:模型保留核心旧表征,同时吸收新知识。该研究由北京理工大学和北京大学团队主导,腾讯AI Lab参与,为LLM的持续学习提供了首个几何层面的理论框架。

技术深度解析

这项研究的核心洞察在于神经网络特征嵌入的几何结构。在预训练阶段,LLM学习到一个高维表征空间,其中概念沿着特定方向组织。当通过微调引入新任务时,模型会调整这些嵌入以适应新模式。研究表明,这种调整会导致现有表征向量发生系统性的旋转和缩放。具体而言,对应旧知识的方向被压缩或旋转偏离其最优朝向,从而导致判别能力的丧失。

这并非随机噪声过程。研究人员发现,冲突表现为旧表征向量与新表征向量之间可测量的角度位移。通过分析微调前后特征嵌入的余弦相似度和范数变化,他们发现遗忘程度与旧任务质心在嵌入空间中的角度偏移强相关。新任务的表征方向与旧任务偏离越大,遗忘就越严重。

为解决这一问题,团队提出了一种名为几何约束微调(Geometric Constraint Fine-Tuning, GCFT)的方法。与弹性权重巩固(Elastic Weight Consolidation, EWC)等对所有权重变化进行惩罚的正则化项不同,GCFT直接约束嵌入空间的几何结构。它引入了一个损失项,在保留一组锚点(来自旧任务的代表性嵌入)之间的相对角度和距离的同时,允许模型学习新表征。实现方式是将新梯度投影到与破坏旧知识的方向正交的子空间上。

一个探索类似思路的相关开源实现是蒂宾根大学的"continual-learning"仓库(GitHub上超过1200颗星),该仓库为各种持续学习算法提供了基准测试。然而,GCFT的独特之处在于其关注几何约束而非参数级别的正则化。

基准性能对比:

| 方法 | CIFAR-100(5个任务)准确率 | LLM微调(MMLU保留率) | 训练开销 |
|---|---|---|---|
| EWC(弹性权重巩固) | 68.2% | 72.1% | +15% 时间 |
| 经验回放 | 74.5% | 78.3% | +40% 内存 |
| GCFT(本文提出) | 79.8% | 85.6% | +8% 时间 |
| 朴素微调 | 45.3% | 38.7% | 0% |

数据要点: GCFT在视觉和语言基准测试中均实现了最高的任务准确率和保留率,同时引入了最小的训练开销。在新领域微调后,85.6%的MMLU保留率相比朴素微调的38.7%有显著提升,证明几何约束比参数级别正则化更有效。

关键参与者与案例研究

该研究由北京理工大学北京大学的团队主导,腾讯AI Lab的研究人员参与。第一作者李伟博士此前曾在NeurIPS和ICML上发表过关于表征学习和持续学习的论文。这项工作建立在Yoshua Bengio团队关于深度网络几何特性的早期理论框架之上,但这是首次将几何冲突直接与LLM的灾难性遗忘联系起来。

多家公司已经在探索相关方法。OpenAI尝试了"模型合并"技术,将不同任务的微调权重组合起来,但这些方法缺乏GCFT的几何基础。Anthropic使用宪法AI来指导微调,但其方法更侧重于对齐而非遗忘预防。Google DeepMind的"渐进式神经网络"为每个任务添加新列,避免了遗忘但扩展性差。

行业方法对比:

| 公司/产品 | 方法 | 关键优势 | 关键局限 |
|---|---|---|---|
| OpenAI(GPT-4o) | 模型合并 + 数据回放 | 常见任务保留率高 | 需要大回放缓冲区;在 niche 任务上失败 |
| Anthropic(Claude 3.5) | 宪法AI + RLHF | 强对齐 | 无显式遗忘控制 |
| Google DeepMind(Gemini) | 渐进式网络 | 无遗忘 | 参数随任务线性增长 |
| GCFT(本研究) | 几何约束 | 高保留率、低开销 | 需要锚点选择 |

数据要点: GCFT在保留率和效率之间提供了最佳平衡。虽然模型合并和渐进式网络很流行,但它们要么需要大量内存,要么扩展性差。GCFT的几何方法更原理化,也更适合实际部署。

行业影响与市场动态

这项研究恰逢关键时刻。LLM市场预计将从2024年的400亿美元增长到2029年的2000亿美元以上(年复合增长率38%)。企业采用的主要瓶颈之一是持续微调的成本——每次更新模型时,企业都面临丢失关键领域知识的风险。GCFT通过提供一种计算开销极小的可控遗忘机制,直接解决了这一问题。

对于AI基础设施公司而言,这意味着更高效的模型更新管道。对于企业用户,它降低了频繁重新训练或维护多个模型版本的需求。对于AI安全领域,选择性遗忘的能力开辟了新的可能性:模型可以有选择地忘记敏感或过时的信息,而无需完全重新训练。

然而,挑战依然存在。锚点选择过程需要仔细设计,并且GCFT在高度异构任务序列上的表现仍有待验证。尽管如此,这项研究标志着从经验性遗忘缓解向理论驱动、几何基础的持续学习方法的范式转变。

更多来自 Hacker News

GPT-5.6 惊现 Codex:OpenAI 在 GPT-5 前布下的战略桥梁模型在对 OpenAI 公开 Codex 仓库的例行扫描中,AINews 发现了一个名为 GPT-5.6 的新模型系列。这并非一次小版本号更新,而是一次精心设计的中间版本发布,旨在 GPT-5 全面推出之前测试和打磨关键能力。'5.6' 的命名Hermes MoA虚拟模型集群:超越Opus 4.8达8%、GPT 5.5达11%,多智能体协作颠覆AI推理范式在重新定义AI推理前沿的惊人进展中,Nous Research发布了Hermes MoA(混合智能体)——一个虚拟模型集群,在关键推理基准测试中,其性能比Opus 4.8高出8%,比GPT 5.5高出11%。与业界痴迷于打造越来越庞大的单体Jetson Orin Nano Super 8GB:小模型如何在边缘AI战场悄然取胜Jetson Orin Nano Super 8GB并非一次简单的硬件升级,而是对AI行业轨迹的战略性校准。在市场聚焦于越来越大的基础模型之际,NVIDIA设计了一款设备,能够完全在设备端运行1-3B参数的语言模型,推理延迟低于100毫秒。查看来源专题页Hacker News 已收录 5342 篇文章

时间归档

May 20263028 篇已发布文章

延伸阅读

Enki的选择性遗忘:将AI成本减半的记忆革命新型AI智能体架构Enki通过仅保留一半记忆数据,实现了与全量记忆相当甚至更优的准确性,颠覆了业界对超大上下文窗口的痴迷。其“选择性遗忘”机制模仿人类记忆,优先保留高价值交互、剔除噪声,从而降低硬件成本、加快响应速度,并为商业部署铺平了清晰动手为王:LLM时代,实践技能为何比理论更重要在大语言模型时代,真正的理解不再来自阅读论文,而是来自动手构建。开发者和研究者认为,只有亲自微调模型、调试幻觉、从零搭建数据集,才能真正内化大语言模型的思考方式。AINews 探讨为何“动手实践”成为新的 AI 素养。反“AI腔”革命:大模型如何告别陈词滥调,写出真正有风格的文章一种名为“反AI腔”(anti-slopping)的新技术范式正在兴起,旨在清除大语言模型中那些标志性的口头禅——比如“值得注意的是”和“深入探讨”。这并非简单的过滤器,而是一种有针对性的微调方法,迫使AI写出真正有风格的文字,标志着从“生记忆悖论:为何AI代理始终无法真正记住你尽管在推理与工具使用上取得突破,所有主流AI代理仍存在一个根本缺陷:它们无法真正记住你。AINews深入探究这一记忆悖论的技术、战略与伦理根源——而解决它,或许将开启自主智能的下一个时代。

常见问题

这次模型发布“Geometric Conflict Revealed: How LLMs Forget and Why Control Is Now Possible”的核心内容是什么?

For years, catastrophic forgetting in large language models (LLMs) has been an empirical black box. Practitioners relied on data replay, regularization, or architectural tweaks to…

从“how does geometric conflict cause catastrophic forgetting in LLMs”看,这个模型发布为什么重要?

The core insight of this research lies in the geometry of neural network feature embeddings. During pre-training, an LLM learns a high-dimensional representation space where concepts are organized along specific directio…

围绕“selective forgetting method for large language models”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。