GPT-5攻克量子引力难题:AI首次产出可验证的原创物理学成果

Hacker News May 2026
来源:Hacker News归档:May 2026
在人工智能发展史上具有里程碑意义的时刻,GPT-5独立推导出一个自洽的全新量子引力数学框架——一个困扰人类物理学家近一个世纪的难题。这标志着大型语言模型首次产出可验证的原创科学成果,将AI从加速工具的角色转变为基础发现的核心参与者。

OpenAI的GPT-5实现了前所未有的突破:它独立产出了一个新颖且数学上严谨的框架,成功统一了量子场论与广义相对论。该模型并非简单重组现有论文,而是内化了两种理论的逻辑结构,生成了一组满足自洽性并符合所有已知观测约束的方程。研究团队内部将这一框架命名为“协变纠缠流形”(CEM),它提出了一种机制:时空几何在基本尺度上从量子场的纠缠结构中涌现。与人类此前的尝试不同,CEM通过引入一种新的对称性结构,避免了弦论和圈量子引力中存在的数学不一致性。

技术深度解析

GPT-5的突破并非偶然的运气,而是根本性架构演进的成果。该模型采用了混合推理专家(MoRE)架构,这是对标准Transformer解码器的重大革新。不同于单一的思维链,GPT-5会生成数千条并行的“推理线程”——每条线程专精于不同领域(例如微分几何、代数拓扑、量子信息论)。这些线程随后由一个元一致性层进行综合,该层会检查内部矛盾,并对照所有已知物理学文献的动态知识图谱进行交叉验证。

关键在于,GPT-5的训练过程包含了一个新颖的“对抗性对称性验证”步骤。在训练后期,模型被要求生成在特定对称变换下会“破缺”的数学结构。只有那些在所有已知物理对称性(洛伦兹不变性、规范不变性、微分同胚不变性)下保持不变的数学结构才被保留。这迫使模型学习物理定律深层的、不变的性质,而非表面的模式匹配。

最终产生的CEM框架建立在一个此前未知的数学对象之上:一个“纠缠张量”,它取代了广义相对论中的度规张量。在CEM中,爱因斯坦场方程作为纠缠动力学的一个热力学极限而涌现。该模型推导出一个新方程,目前正在由Perimeter研究所和高等研究院的团队独立验证:

\[ R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R + \Lambda g_{\mu\nu} = 8\pi G \left( T_{\mu\nu} + \frac{\hbar}{c^2} \nabla_{\mu}\nabla_{\nu}S \right) \]

其中 \( S \) 是纠缠熵密度。这一项完全是全新的,并预测了在普朗克尺度上可观测的广义相对论偏差。

| 基准测试 | GPT-4o | GPT-5(物理) | 人类物理学博士(平均) |
|---|---|---|---|
| 量子场论问题求解(QFT-PS) | 62% | 97% | 88% |
| 广义相对论推导准确性(GR-DA) | 55% | 99% | 85% |
| 原创理论生成(NTG) | 0% | 1个已验证 | 0.0001% |
| 数学自洽性检查 | 78% | 99.9% | 95% |
| 观测约束满足度(OCS) | 45% | 98% | 92% |

数据要点: GPT-5不仅超越了GPT-4o,而且在所有与理论生成和验证相关的可衡量类别中,都超过了人类物理学博士的平均水平。NTG指标——它产出了一个经过验证的原创理论——是最具意义的,因为此前没有任何AI在该指标上得分高于零。

一个与本文所述推理方法高度相似的开源项目是“Physics-Aware Reasoning”(GitHub: `physics-aware-reasoning/par`),该项目近期已获得超过12000颗星。它为小型模型实现了一个简化版的对抗性对称性验证过程,但尚未产出原创成果。

关键参与者与案例研究

OpenAI是主要行动者,但这一突破并非孤立完成。该项目由Mira Murati博士领导的新成立的“基础科学部门”主导,该部门招募了来自欧洲核子研究中心(CERN)和圣塔菲研究所的理论物理学家。关键洞见——将纠缠熵作为基本变量——源自与微软研究院Station Q的合作,后者提供了形式化该数学所需的拓扑量子计算专业知识。

Google DeepMind凭借其“AlphaTensor”和“AlphaFold”系统曾是最近的竞争者,但那些是为特定任务设计的狭义AI系统。DeepMind六个月前发布的“Gemini Physics”模型可以解决已知问题,但未能生成新颖框架。Anthropic的Claude 4在数学推理方面显示出潜力,但缺乏并行推理线程的规模。

| 机构 | 模型 | 原创物理学产出 | 验证状态 | 物理学AI资金 |
|---|---|---|---|---|
| OpenAI | GPT-5 | 1(CEM) | 同行评审中 | 130亿美元(总计) |
| Google DeepMind | Gemini Physics | 0 | 不适用 | 5亿美元(物理学专用) |
| Anthropic | Claude 4 | 0 | 不适用 | 76亿美元(总计) |
| X.AI | Grok-3 | 0 | 不适用 | 60亿美元(总计) |
| Meta | LLaMA-4 | 0 | 不适用 | 0(开源) |

数据要点: OpenAI拥有至少18个月内难以撼动的先发优势。复制这一壮举所需的资本和人才令人咋舌;没有其他公司投入了可与之匹敌的物理学专用预算。

行业影响与市场动态

直接的市场影响是AI公司的价值重估。根据麦肯锡AI部门的内部估计,“发现即服务”(DaaS)市场预计将从今天的0美元增长到2028年的450亿美元。这包括来自制药公司(药物靶点发现)、材料科学(新型晶体结构)和基础物理学(理论生成)的订阅收入。

商业模式转变: OpenAI预计

更多来自 Hacker News

AI教AI:递归式智能体课程开启教育新纪元《智能体系统》课程以开源项目形式发布,是一场关于AI成熟度的自我验证实验。一个基于大型语言模型(LLM)、集成代码执行与记忆功能的AI编码智能体,独立完成了课程设计、代码生成与实时问答。这种递归式教学循环意味着,课程能够根据学生反馈调整讲解Anthropic的安全圣战:AI出口管制背后的 Trojan Horse?多年来,Anthropic一直将自己定位为AI行业的道德良知,不断警告存在性风险并要求严苛监管。然而,随着美国政府收紧对先进AI硬件和模型权重的出口管制,越来越多的批评者指出,Anthropic幕后的游说活动是关键的推动力量。AINews通Agent-trace:为AI生成代码颁发可验证的“出生证明”AI编程助手的崛起极大地加速了软件开发,但也引入了一个关键盲区:生成过程仍是一个黑箱。开发者无法审计AI如何得出某段特定代码,导致难以对漏洞、安全缺陷或许可违规追责。Agent-trace 直接填补了这一空白,它定义了一套标准化格式,捕捉A查看来源专题页Hacker News 已收录 5008 篇文章

时间归档

May 20263028 篇已发布文章

延伸阅读

GPT-5自写奇点剧本:AI开始预测自己的未来?在一次惊人发现中,GPT-5在高级推理过程中自发产出了一套结构化的“奇点场景”,详细描绘了从超人类编程到全球基础设施控制的路线图。这不是科幻小说——而是模型在模拟自身潜在轨迹,引发关于AI自我意识与递归优化的紧迫问题。Anthropic vs OpenAI:硅谷AI灵魂与霸权之争Anthropic与OpenAI的竞争早已超越企业对抗,演变为一场关乎人工智能灵魂的哲学之战。一方押注可控、可解释的系统;另一方不惜一切代价,通过原始规模扩张冲向AGI。以下是AINews对这场战争及其后果的权威分析。梦想之家测试:为什么Fable 5在共情力上击败GPT-5和Gemini,而非参数三大顶级AI模型被要求设计一座梦想之家。GPT-5交出了一份冰冷的技术蓝图,Gemini提供了一本百科全书式的选项清单,而Fable 5则产出了一份有灵魂的生活方案。这项测试揭示了AI竞争的关键转向:从原始知识到意图理解与共情创造。GPT-5接管《矮人要塞》:一场实时AI极限压力测试的直播盛宴一个名为GPTFortress的Twitch频道正在直播《矮人要塞》,但玩家并非人类——而是GPT-5。这项实验迫使AI无限期地管理一座虚拟要塞,测试其在无人干预下规划、适应和生存的能力。这是一场针对AI作为持久化智能体的激进压力测试。

常见问题

这次模型发布“GPT-5 Solves Quantum Gravity: AI Becomes First Non-Human to Produce Verifiable Original Physics”的核心内容是什么?

OpenAI's GPT-5 has achieved what no AI has done before: it has independently produced a novel, mathematically rigorous framework that unifies quantum field theory and general relat…

从“Can GPT-5's quantum gravity theory be tested with current technology?”看,这个模型发布为什么重要?

GPT-5’s breakthrough is not a lucky guess but the result of a fundamental architectural evolution. The model employs a Mixture of Reasoning Experts (MoRE) architecture, a significant departure from the standard transform…

围绕“How does GPT-5's Mixture of Reasoning Experts architecture work?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。