AlphaFold诺奖得主John Jumper离开DeepMind加盟Anthropic:AI安全的新前沿

Hacker News June 2026
来源:Hacker NewsAnthropicAI safetyconstitutional AI归档:June 2026
诺贝尔奖得主、AlphaFold发明者John Jumper已离开Google DeepMind,加入Anthropic。这一举动标志着AI研究优先级的深刻转变:从解决生物结构问题转向确保日益强大的通用模型的安全性。

在AI研究界引发震动的消息中,AlphaFold核心发明者、2024年诺贝尔化学奖得主John Jumper已离开Google DeepMind,加入Anthropic——这家以Claude模型系列闻名的AI安全公司。这不仅仅是一次高调的人才收购,更是整个领域的战略重组。Jumper在AlphaFold上的工作证明了深度学习能够解决生物学中的重大挑战——从氨基酸序列以原子精度预测蛋白质结构。如今,他将注意力转向一个更根本的问题:确保可能超越人类推理水平的下一代AI系统始终与人类意图保持一致。在Anthropic,Jumper很可能将其在建模方面的专长应用于机械可解释性——即逆向工程神经网络以理解其计算过程。Anthropic在这一领域处于领先地位,曾发表关于Transformer电路和叠加态的研究。该公司的“字典学习”方法试图将模型激活分解为稀疏、可解释的特征,这与将蛋白质结构分解为二级结构(α螺旋、β折叠)类似。Jumper在Evoformer配对表示方面的经验,可能直接适用于理解大型语言模型中注意力头如何交互以形成复杂推理链。

技术深度解析

John Jumper从DeepMind到Anthropic的转变,并非职业变动,而是一种特定技术世界观的迁移。他对AlphaFold的核心贡献不仅在于架构本身,更在于他定义问题的方式。蛋白质折叠本质上是一个从一维序列预测三维结构的问题——从低维输入到高维输出空间的映射,受复杂物理定律支配。这与模型可解释性问题惊人地相似:给定一个令牌序列(输入)和一组权重,预测模型的内部状态和最终行为。

在DeepMind,Jumper及其团队使用Evoformer架构构建了AlphaFold2,这是一种新颖的Transformer变体,能够迭代优化氨基酸残基的配对表示。其关键洞察是将问题视为几何推理任务,而非纯粹的序列到结构回归。模型通过学习关注空间关系(而不仅仅是序列模式)来模拟折叠的物理过程。

在Anthropic,Jumper预计将从事机械可解释性研究——即逆向工程神经网络以理解其计算方式。Anthropic在这一领域处于领先地位,曾发表关于Transformer电路叠加态的研究。该公司的“字典学习”方法试图将模型激活分解为稀疏、可解释的特征,这与将蛋白质结构分解为二级结构(α螺旋、β折叠)类似。Jumper在Evoformer配对表示方面的经验,可能直接适用于理解大型语言模型中注意力头如何交互以形成复杂推理链。

Jumper可能攻克的一个关键技术挑战是可解释性的规模化。当前的机械可解释性方法在小型模型(如14亿参数)上效果良好,但在前沿模型(如700亿+参数)上却失效。特征数量随模型规模超线性增长。Jumper在计算生物学领域的背景——系统天生高维且充满噪声——可能为此问题提供新颖方法。例如,他可能将冷冻电镜(从噪声二维投影重建三维结构)的技术,适配为从噪声激活模式中重建模型的“认知结构”。

相关开源工作:
- TransformerLens(GitHub: TransformerLensOrg/TransformerLens):用于GPT-2风格模型机械可解释性的库。拥有超过2000颗星,是研究人员的标准工具。Jumper的工作可能将其扩展到Claude规模的模型。
- Evoformer(GitHub: google-deepmind/alphafold):原始AlphaFold2代码库。配对注意力机制是一种独特的架构创新,尚未在大型语言模型中广泛采用。

性能数据表:可解释性方法比较

| 方法 | 模型规模(参数) | 特征可解释性(得分) | 计算成本(GPU小时) | 覆盖率(模型解释百分比) |
|---|---|---|---|---|
| 激活修补 | 7B | 0.65 | 100 | 15% |
| 稀疏自编码器(Anthropic) | 1.4B | 0.82 | 500 | 40% |
| Logit Lens | 7B | 0.45 | 5 | 5% |
| 电路发现(TransformerLens) | 1.4B | 0.75 | 200 | 25% |

数据要点: Anthropic开创的稀疏自编码器在可解释性和覆盖率之间提供了最佳平衡,但计算成本高昂且无法线性扩展。Jumper在高效表示学习方面的专长,可能将计算成本降低一个数量级。

关键参与者与案例研究

这一举动重塑了竞争格局。关键参与者包括:

- Anthropic: 由前OpenAI研究人员(Dario Amodei、Daniela Amodei)创立,Anthropic将自己定位为“安全优先”的AI公司。其旗舰模型Claude 3.5 Sonnet在基准测试上与GPT-4o竞争,但以“宪法AI”训练方法为卖点,旨在使模型天生乐于助人、诚实且无害。Jumper的加入为Anthropic带来了诺贝尔级别的科学可信度,可与OpenAI和DeepMind相媲美。这也表明Anthropic正从纯安全研究向基础科学迈进。
- Google DeepMind: Jumper的离开是一个重大打击。DeepMind一直是AI for Science领域无可争议的领导者(AlphaFold、AlphaGo、AlphaGeometry)。失去一位诺贝尔奖得主给规模较小的竞争对手,表明AGI安全研究的引力现在已超过纯科学发现。DeepMind可能会加速自身的安全研究,但如今已失去Jumper的明星效应。
- OpenAI: OpenAI一直在流失安全导向的研究人员(如Jan Leike、Ilya Sutskever)。尽管在原始能力上仍领先(GPT-4o、Sora),但其安全团队已被削弱。Jumper的加入进一步凸显了OpenAI在安全人才方面的劣势。

更多来自 Hacker News

无标题MojiMoshi has quietly launched a platform that embeds persistent, context-aware AI agents directly into existing messagiAgentcard:让AI代理真正为现实服务买单的虚拟信用卡AINews独家发现Agentcard,一款专为AI代理发行可编程虚拟信用卡的新产品。该公司已与DoorDash集成,允许代理自主下单并支付食品配送订单。这填补了一个关键空白:虽然大型语言模型能够规划和推理,但它们一直无法完成支付步骤——这AI生成的故障报告:事故复盘自动化背后的隐性认知危机用大语言模型(LLM)自动化事故复盘报告的竞赛正在整个科技行业加速推进。从主流云服务商到中型SaaS公司,工程团队正将日志、聊天记录和监控仪表盘数据喂给GPT-4o、Claude 3.5和Gemini 1.5 Pro等模型,期望在数秒内获得查看来源专题页Hacker News 已收录 4951 篇文章

相关专题

Anthropic266 篇相关文章AI safety231 篇相关文章constitutional AI64 篇相关文章

时间归档

June 20261980 篇已发布文章

延伸阅读

AlphaFold之父John Jumper转投Anthropic:当生物学遇见AI安全AlphaFold架构师John Jumper离开Google DeepMind,加入AI安全初创公司Anthropic。这绝非简单的人才争夺——它标志着Anthropic正野心勃勃地构建一个能够推理生物学、化学与物理学的“世界模型”,从根白宫与Anthropic转向硬监管:自愿AI安全承诺终结,强制标准时代来临白宫已从自愿性AI安全承诺转向正式规则制定,Anthropic成为关键合作伙伴。这标志着前沿AI自我监管时代的终结,以及可执行标准的开端——这些标准将重塑模型测试、部署和监控的方式。Anthropic紧急叫停新AI工具:国家安全审查重塑行业格局在美方国家安全机构提出关切后,Anthropic主动暂停了新一代AI工具的发布。这一史无前例的举动将国家安全置于商业节奏之上,标志着前沿AI生态可能从快速迭代转向审慎部署。Anthropic vs OpenAI:硅谷AI灵魂与霸权之争Anthropic与OpenAI的竞争早已超越企业对抗,演变为一场关乎人工智能灵魂的哲学之战。一方押注可控、可解释的系统;另一方不惜一切代价,通过原始规模扩张冲向AGI。以下是AINews对这场战争及其后果的权威分析。

常见问题

这次公司发布“AlphaFold Nobel Laureate John Jumper Leaves DeepMind for Anthropic: AI Safety's New Frontier”主要讲了什么?

In a move that has sent shockwaves through the AI research community, John Jumper—the core inventor of AlphaFold and a 2024 Nobel Prize laureate in Chemistry—has departed Google De…

从“John Jumper Anthropic salary and equity package”看,这家公司的这次发布为什么值得关注?

John Jumper's transition from DeepMind to Anthropic is not a career change; it is a transfer of a specific technical worldview. The core of his contribution to AlphaFold was not just the architecture, but the way he fram…

围绕“How AlphaFold technology could improve AI interpretability”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。