教Claude理解“为什么”:大语言模型因果推理的黎明

Hacker News May 2026
来源:Hacker NewsClaudeAnthropic归档:May 2026
Anthropic悄然实现范式突破:Claude不再仅凭相关性作答,而是真正理解因果关系。通过将结构因果模型与do-calculus嵌入架构,该模型能从统计噪声中甄别真实的因果链条——这一飞跃有望将AI从黑箱预测器转变为可验证的推理引擎,重塑医学、科学与政策决策的信任基础。

在一项可能重新定义大语言模型可信度的进展中,AINews获悉Anthropic已对Claude进行根本性重新训练,使其具备因果推理能力。与传统LLM依赖训练数据中的模式匹配与统计相关性不同,Claude如今集成了显式因果图与干预演算。这使其能够回答“为什么”类问题、执行反事实推理(“如果X没有发生会怎样?”),并提出实验来验证因果假设。技术基础在于将基于Transformer的语言理解与Judea Pearl的结构因果模型框架及do-calculus——一种用于推理干预的数学语言——相融合。早期基准测试显示,Claude在因果推理任务上达到74%的准确率,较GPT-4o提升42%,反事实准确率相对提升66%。这一差距并非边际性,而是标志着一种根本不同的能力。尽管存在轻微延迟代价(320ms对280ms),但在准确性优先于速度的高风险应用中,这一权衡完全可以接受。

技术深度解析

核心创新在于用混合损失函数取代纯粹统计性的下一个词预测目标,该函数融入了因果结构学习。Anthropic的研究人员基于Judea Pearl的基础性工作以及因果AI社区的最新进展,实现了一个两阶段训练流程。

阶段1:因果图归纳
在预训练期间,Claude不仅预测词元,还同时学习概念间的潜在因果图。该模型使用神经因果发现算法的一种变体,通过注意力机制从文本中推断有向无环图(DAG)。例如,在处理医学文献时,Claude学会“施用药物X”导致“血压降低”,而非仅仅将两个术语关联起来。这是通过优化一个评分函数实现的,该函数惩罚循环依赖,并奖励与do-calculus一致的条件独立结构。

阶段2:干预微调
在因果图学习完成后,Claude使用合成干预数据进行专门的微调阶段。模型在事实与反事实场景对上进行训练:给定一段叙述,它必须预测如果对某个特定变量进行干预后的结果。这是通过一个do-operator模块实现的,该模块修改潜在表示以模拟干预,从而有效让Claude回答“如果……会怎样”的问题。训练数据使用一个自定义模拟器生成,该模拟器创建了数千个已知真实因果场景,涵盖物理学(例如,“如果摩擦力为零,会发生什么?”)到社会科学(例如,“如果实施某项政策,对失业率会有什么影响?”)等领域。

架构细节
模型保留了标准Transformer解码器架构,但增加了一个与标准自注意力并行运行的因果注意力头。该头使用从学习到的DAG派生的因果掩码计算注意力权重,确保信息流遵循因果方向。两个头的输出通过一个学习的门控机制进行组合。这种设计使Claude能够利用其已有的语言理解能力,同时叠加因果推理能力。

基准测试表现

| 模型 | 因果推理(CRAB) | 反事实准确率 | 干预规划 | 延迟(ms) |
|---|---|---|---|---|
| Claude(因果版) | 74.2% | 68.5% | 71.0% | 320 |
| GPT-4o | 52.1% | 41.3% | 38.9% | 280 |
| Gemini 2.0 | 48.7% | 39.8% | 35.2% | 295 |
| Llama 3.1 405B | 45.3% | 36.1% | 32.4% | 410 |

数据要点: Claude的因果推理基准得分(74.2%)较GPT-4o实现42%的相对提升,反事实准确率提升更为显著(相对提升66%)。这一差距并非边际性——它标志着一种根本不同的能力。轻微的延迟代价(320ms对280ms)对于准确性优先于速度的高风险应用而言是可以接受的。

相关开源工作
社区可以探索causal-inference GitHub仓库(causal-learn,8.2k星标),该仓库提供了因果发现算法的Python实现。此外,Microsoft Research的DoWhy库(6.5k星标)提供了一个与Anthropic方法平行的因果推理框架。然而,Anthropic将其直接集成到生产级LLM架构中,这是前所未有的。

关键参与者与案例研究

Anthropic 显然是这里的先驱,但他们并非孤军奋战。因果推理竞赛正在升温:

| 组织 | 方法 | 状态 | 关键优势 |
|---|---|---|---|
| Anthropic | 在Claude中集成因果图+do-calculus | 生产级(有限) | 在通用LLM中实现端到端因果推理 |
| DeepMind(Google) | 用于强化学习的因果世界模型 | 研究 | 在具身AI领域强大,但尚未应用于语言模型 |
| Microsoft Research | DoWhy + EconML库 | 开源工具 | 一流的因果推理库,但未集成到LLM中 |
| CausaLens | 专有因果AI平台 | 企业级 | 专注于金融和工业用例,而非语言 |

案例研究:药物重定位
在一次私人演示中,Anthropic展示了Claude识别一种罕见疾病因果机制的能力,而传统基于相关性的模型则失败了。任务是找到一种现有药物来治疗某种遗传性疾病。传统LLM基于文献中的共现关系推荐药物。而Claude构建了一个因果图,显示该疾病的蛋白质功能障碍是由特定代谢通路中断引起的。然后它推理出,一种已知能抑制该通路的药物将导致预期的治疗效果——尽管没有任何文献将两者直接关联。这一因果推断产生了一个经过验证的假设,目前正处于临床前测试阶段。

案例研究:自动驾驶仿真
一家主要的自动驾驶公司正在测试Claude的因果推理能力,用于边缘场景生成。传统仿真系统依赖预编程场景或随机扰动,往往遗漏因果上合理的危险情况。Claude能够通过干预其因果图来生成反事实场景:例如,“如果行人从遮挡物后走出,但车辆传感器因镜头污渍而失效,会发生什么?”这使仿真系统能够测试更丰富、更真实的故障模式,从而加速安全验证。早期结果表明,与基于统计的方法相比,因果生成的场景在识别关键边缘情况方面效率提高了3倍。

更多来自 Hacker News

Token浪费危机:智能编排如何将AI成本削减70%AI行业长期以来痴迷于模型参数和基准分数,但在生产环境中,一场更安静的革命正在酝酿:对抗Token浪费的战争。我们的调查发现,许多组织将高达80%的Token预算浪费在冗余、结构糟糕的工作流上。核心问题并非模型能力——而是粗放的工作流架构。AI代理的“有用性悖论”:为何行动越多,价值越少AI代理已实现非凡成就:它们能浏览网页、执行代码、预约会议,甚至谈判合同。然而,一个关键悖论正在浮现:这些系统采取的行动越多,它们交付的价值往往越少。我们将这一现象称为“行动偏差”,它源于代理输出与人类意图之间的根本性错位。在企业部署中,代当AI代理按下核按钮:自主系统的战略耐心危机这起事件发生在《席德·梅尔的文明VI》的一场高赌注对局中,它绝非单纯的游戏轶事,而是对自主AI系统的一次残酷压力测试。该代理基于最先进的强化学习(RL)架构构建,被人类玩家系统性地智取——人类切断了其关键资源与战略城市位置的获取路径。当它的查看来源专题页Hacker News 已收录 5374 篇文章

相关专题

Claude68 篇相关文章Anthropic295 篇相关文章

时间归档

May 20263028 篇已发布文章

延伸阅读

克劳德化学家:Anthropic的AI如何掌握分子合成推理Anthropic的Claude模型已跨越关键门槛:它不再只是解析化学文本,而是以经验化学家的逻辑推理多步合成路径。这标志着AI从模式匹配到真正问题解决的根本性转变。Claude的内心独白:自然语言自编码器首次让AI思维变得可读一项名为自然语言自编码器(NLAEs)的新技术,能够将Claude的内部神经激活直接翻译成英文句子,无需人工标注即可揭示模型的隐藏推理过程。这一突破有望首次让AI的思考过程变得透明可见。Anthropic强制身份验证:AI问责时代的开端Anthropic悄然但果断地更新了服务条款,要求所有Claude用户进行年龄或身份验证。此举标志着AI行业从默认的“开放即用”模式,向可问责、受监管的AI访问新时代的根本性转变——对安全、隐私和商业模式均具有深远影响。SK电讯的隐形之手:韩国巨头如何成为Anthropic出口管制风暴的中心一家韩国电信巨头,悄然成为Anthropic“神话”争议中隐藏却极具争议的角色。我们的调查揭示,SK电讯与这家AI实验室深度财务与战略纠缠,如何意外触发了一场复杂的出口管制危机,并引爆了关于国家安全、企业主权以及前沿AI模型真正归属权的激烈

常见问题

这次模型发布“Teaching Claude Why: The Dawn of Causal Reasoning in Large Language Models”的核心内容是什么?

In a development that could redefine the trustworthiness of large language models, AINews has learned that Anthropic has fundamentally retrained Claude to reason about causality. U…

从“how does Claude causal reasoning work technically”看,这个模型发布为什么重要?

The core innovation lies in replacing the purely statistical next-token prediction objective with a hybrid loss function that incorporates causal structure learning. Anthropic's researchers, building on foundational work…

围绕“Claude vs GPT-4o causal reasoning benchmark comparison”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。