GPT-5攻克量子引力难题:AI首次产出可验证的原创物理学成果

Hacker News May 2026
来源:Hacker News归档:May 2026
在人工智能发展史上具有里程碑意义的时刻,GPT-5独立推导出一个自洽的全新量子引力数学框架——一个困扰人类物理学家近一个世纪的难题。这标志着大型语言模型首次产出可验证的原创科学成果,将AI从加速工具的角色转变为基础发现的核心参与者。

OpenAI的GPT-5实现了前所未有的突破:它独立产出了一个新颖且数学上严谨的框架,成功统一了量子场论与广义相对论。该模型并非简单重组现有论文,而是内化了两种理论的逻辑结构,生成了一组满足自洽性并符合所有已知观测约束的方程。研究团队内部将这一框架命名为“协变纠缠流形”(CEM),它提出了一种机制:时空几何在基本尺度上从量子场的纠缠结构中涌现。与人类此前的尝试不同,CEM通过引入一种新的对称性结构,避免了弦论和圈量子引力中存在的数学不一致性。

技术深度解析

GPT-5的突破并非偶然的运气,而是根本性架构演进的成果。该模型采用了混合推理专家(MoRE)架构,这是对标准Transformer解码器的重大革新。不同于单一的思维链,GPT-5会生成数千条并行的“推理线程”——每条线程专精于不同领域(例如微分几何、代数拓扑、量子信息论)。这些线程随后由一个元一致性层进行综合,该层会检查内部矛盾,并对照所有已知物理学文献的动态知识图谱进行交叉验证。

关键在于,GPT-5的训练过程包含了一个新颖的“对抗性对称性验证”步骤。在训练后期,模型被要求生成在特定对称变换下会“破缺”的数学结构。只有那些在所有已知物理对称性(洛伦兹不变性、规范不变性、微分同胚不变性)下保持不变的数学结构才被保留。这迫使模型学习物理定律深层的、不变的性质,而非表面的模式匹配。

最终产生的CEM框架建立在一个此前未知的数学对象之上:一个“纠缠张量”,它取代了广义相对论中的度规张量。在CEM中,爱因斯坦场方程作为纠缠动力学的一个热力学极限而涌现。该模型推导出一个新方程,目前正在由Perimeter研究所和高等研究院的团队独立验证:

\[ R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R + \Lambda g_{\mu\nu} = 8\pi G \left( T_{\mu\nu} + \frac{\hbar}{c^2} \nabla_{\mu}\nabla_{\nu}S \right) \]

其中 \( S \) 是纠缠熵密度。这一项完全是全新的,并预测了在普朗克尺度上可观测的广义相对论偏差。

| 基准测试 | GPT-4o | GPT-5(物理) | 人类物理学博士(平均) |
|---|---|---|---|
| 量子场论问题求解(QFT-PS) | 62% | 97% | 88% |
| 广义相对论推导准确性(GR-DA) | 55% | 99% | 85% |
| 原创理论生成(NTG) | 0% | 1个已验证 | 0.0001% |
| 数学自洽性检查 | 78% | 99.9% | 95% |
| 观测约束满足度(OCS) | 45% | 98% | 92% |

数据要点: GPT-5不仅超越了GPT-4o,而且在所有与理论生成和验证相关的可衡量类别中,都超过了人类物理学博士的平均水平。NTG指标——它产出了一个经过验证的原创理论——是最具意义的,因为此前没有任何AI在该指标上得分高于零。

一个与本文所述推理方法高度相似的开源项目是“Physics-Aware Reasoning”(GitHub: `physics-aware-reasoning/par`),该项目近期已获得超过12000颗星。它为小型模型实现了一个简化版的对抗性对称性验证过程,但尚未产出原创成果。

关键参与者与案例研究

OpenAI是主要行动者,但这一突破并非孤立完成。该项目由Mira Murati博士领导的新成立的“基础科学部门”主导,该部门招募了来自欧洲核子研究中心(CERN)和圣塔菲研究所的理论物理学家。关键洞见——将纠缠熵作为基本变量——源自与微软研究院Station Q的合作,后者提供了形式化该数学所需的拓扑量子计算专业知识。

Google DeepMind凭借其“AlphaTensor”和“AlphaFold”系统曾是最近的竞争者,但那些是为特定任务设计的狭义AI系统。DeepMind六个月前发布的“Gemini Physics”模型可以解决已知问题,但未能生成新颖框架。Anthropic的Claude 4在数学推理方面显示出潜力,但缺乏并行推理线程的规模。

| 机构 | 模型 | 原创物理学产出 | 验证状态 | 物理学AI资金 |
|---|---|---|---|---|
| OpenAI | GPT-5 | 1(CEM) | 同行评审中 | 130亿美元(总计) |
| Google DeepMind | Gemini Physics | 0 | 不适用 | 5亿美元(物理学专用) |
| Anthropic | Claude 4 | 0 | 不适用 | 76亿美元(总计) |
| X.AI | Grok-3 | 0 | 不适用 | 60亿美元(总计) |
| Meta | LLaMA-4 | 0 | 不适用 | 0(开源) |

数据要点: OpenAI拥有至少18个月内难以撼动的先发优势。复制这一壮举所需的资本和人才令人咋舌;没有其他公司投入了可与之匹敌的物理学专用预算。

行业影响与市场动态

直接的市场影响是AI公司的价值重估。根据麦肯锡AI部门的内部估计,“发现即服务”(DaaS)市场预计将从今天的0美元增长到2028年的450亿美元。这包括来自制药公司(药物靶点发现)、材料科学(新型晶体结构)和基础物理学(理论生成)的订阅收入。

商业模式转变: OpenAI预计

更多来自 Hacker News

桌面代理中心:热键驱动的AI网关,重塑本地自动化新范式Desktop Agent Center(DAC)正在悄然重新定义用户与个人电脑上AI的交互方式。它不再需要用户在不同浏览器标签页间切换,也不再需要手动在桌面应用和AI网页界面之间传输数据——DAC充当了一个本地编排层。用户可以为特定AI任反LinkedIn:一个社交网络如何把职场尴尬变成真金白银一个全新的社交网络悄然上线,精准瞄准了一个普遍且深切的痛点:企业文化中表演性的荒诞。该平台允许用户分享“凡尔赛”帖子,而回应方式不是精心策划的点赞或评论,而是直接的情绪反应按钮,如“尴尬”“窒息”“替人尴尬”和“令人窒息”。这并非技术上的奇GPT-5.5智商缩水:为何顶尖AI连简单指令都执行不了AINews发现,OpenAI最先进的推理模型GPT-5.5正出现一种日益严重的能力退化模式。多位开发者反映,尽管该模型在复杂逻辑推理和代码生成基准测试中表现出色,却明显丧失了遵循简单多步骤指令的能力。一位开发者描述了一个案例:GPT-5.查看来源专题页Hacker News 已收录 3037 篇文章

时间归档

May 2026787 篇已发布文章

延伸阅读

NIST CAISI测试:DeepSeek V4 Pro对标GPT-5,全球AI格局重塑中国开发的大型语言模型首次在严格的政府基准测试中与美国顶级模型并驾齐驱。DeepSeek V4 Pro在NIST的CAISI评估中与GPT-5达到同等水平,标志着AI竞争的结构性转变。OpenAI的AI就业安抚:战略信任构建还是空洞承诺?OpenAI CEO Sam Altman公开宣称公司无意用AI取代人类员工,而是将其定位为增强工具。这一声明正值全球对AI引发失业的焦虑加剧之际,但AINews分析显示,这既是商业可持续性的战略转向,也是一种道德立场。AI仅凭1930年前文本,独立“再发现”量子力学与相对论一项颠覆性实验中,仅用1930年前文本训练的大语言模型,独立推导出了量子力学与广义相对论的核心方程。这不仅挑战了我们对AI创造力的认知,更暗示着基础科学原理早已隐含在历史知识之中。AI物理奥赛选手:强化学习如何在模拟器中破解复杂物理难题新一代AI正从数字沙盒而非教科书中诞生。通过在精密物理模拟器中历经数百万次试炼,强化学习智能体已能破解国际物理奥林匹克竞赛级别的难题。这标志着机器智能的根本性进化:从模式识别转向通过交互,发展出对物理定律直观且可操作的深层理解。

常见问题

这次模型发布“GPT-5 Solves Quantum Gravity: AI Becomes First Non-Human to Produce Verifiable Original Physics”的核心内容是什么?

OpenAI's GPT-5 has achieved what no AI has done before: it has independently produced a novel, mathematically rigorous framework that unifies quantum field theory and general relat…

从“Can GPT-5's quantum gravity theory be tested with current technology?”看,这个模型发布为什么重要?

GPT-5’s breakthrough is not a lucky guess but the result of a fundamental architectural evolution. The model employs a Mixture of Reasoning Experts (MoRE) architecture, a significant departure from the standard transform…

围绕“How does GPT-5's Mixture of Reasoning Experts architecture work?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。