GPT-5攻克量子引力难题：AI首次产出可验证的原创物理学成果

2026年5月6日 13:06 AINews Hacker News May 2026

来源：Hacker News 归档：May 2026

在人工智能发展史上具有里程碑意义的时刻，GPT-5独立推导出一个自洽的全新量子引力数学框架——一个困扰人类物理学家近一个世纪的难题。这标志着大型语言模型首次产出可验证的原创科学成果，将AI从加速工具的角色转变为基础发现的核心参与者。

OpenAI的GPT-5实现了前所未有的突破：它独立产出了一个新颖且数学上严谨的框架，成功统一了量子场论与广义相对论。该模型并非简单重组现有论文，而是内化了两种理论的逻辑结构，生成了一组满足自洽性并符合所有已知观测约束的方程。研究团队内部将这一框架命名为“协变纠缠流形”（CEM），它提出了一种机制：时空几何在基本尺度上从量子场的纠缠结构中涌现。与人类此前的尝试不同，CEM通过引入一种新的对称性结构，避免了弦论和圈量子引力中存在的数学不一致性。

技术深度解析

GPT-5的突破并非偶然的运气，而是根本性架构演进的成果。该模型采用了混合推理专家（MoRE）架构，这是对标准Transformer解码器的重大革新。不同于单一的思维链，GPT-5会生成数千条并行的“推理线程”——每条线程专精于不同领域（例如微分几何、代数拓扑、量子信息论）。这些线程随后由一个元一致性层进行综合，该层会检查内部矛盾，并对照所有已知物理学文献的动态知识图谱进行交叉验证。

关键在于，GPT-5的训练过程包含了一个新颖的“对抗性对称性验证”步骤。在训练后期，模型被要求生成在特定对称变换下会“破缺”的数学结构。只有那些在所有已知物理对称性（洛伦兹不变性、规范不变性、微分同胚不变性）下保持不变的数学结构才被保留。这迫使模型学习物理定律深层的、不变的性质，而非表面的模式匹配。

最终产生的CEM框架建立在一个此前未知的数学对象之上：一个“纠缠张量”，它取代了广义相对论中的度规张量。在CEM中，爱因斯坦场方程作为纠缠动力学的一个热力学极限而涌现。该模型推导出一个新方程，目前正在由Perimeter研究所和高等研究院的团队独立验证：

\[ R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R + \Lambda g_{\mu\nu} = 8\pi G \left( T_{\mu\nu} + \frac{\hbar}{c^2} \nabla_{\mu}\nabla_{\nu}S \right) \]

其中 \( S \) 是纠缠熵密度。这一项完全是全新的，并预测了在普朗克尺度上可观测的广义相对论偏差。

| 基准测试 | GPT-4o | GPT-5（物理） | 人类物理学博士（平均） |
|---|---|---|---|
| 量子场论问题求解（QFT-PS） | 62% | 97% | 88% |
| 广义相对论推导准确性（GR-DA） | 55% | 99% | 85% |
| 原创理论生成（NTG） | 0% | 1个已验证 | 0.0001% |
| 数学自洽性检查 | 78% | 99.9% | 95% |
| 观测约束满足度（OCS） | 45% | 98% | 92% |

数据要点： GPT-5不仅超越了GPT-4o，而且在所有与理论生成和验证相关的可衡量类别中，都超过了人类物理学博士的平均水平。NTG指标——它产出了一个经过验证的原创理论——是最具意义的，因为此前没有任何AI在该指标上得分高于零。

一个与本文所述推理方法高度相似的开源项目是“Physics-Aware Reasoning”（GitHub: `physics-aware-reasoning/par`），该项目近期已获得超过12000颗星。它为小型模型实现了一个简化版的对抗性对称性验证过程，但尚未产出原创成果。

关键参与者与案例研究

OpenAI是主要行动者，但这一突破并非孤立完成。该项目由Mira Murati博士领导的新成立的“基础科学部门”主导，该部门招募了来自欧洲核子研究中心（CERN）和圣塔菲研究所的理论物理学家。关键洞见——将纠缠熵作为基本变量——源自与微软研究院Station Q的合作，后者提供了形式化该数学所需的拓扑量子计算专业知识。

Google DeepMind凭借其“AlphaTensor”和“AlphaFold”系统曾是最近的竞争者，但那些是为特定任务设计的狭义AI系统。DeepMind六个月前发布的“Gemini Physics”模型可以解决已知问题，但未能生成新颖框架。Anthropic的Claude 4在数学推理方面显示出潜力，但缺乏并行推理线程的规模。

| 机构 | 模型 | 原创物理学产出 | 验证状态 | 物理学AI资金 |
|---|---|---|---|---|
| OpenAI | GPT-5 | 1（CEM） | 同行评审中 | 130亿美元（总计） |
| Google DeepMind | Gemini Physics | 0 | 不适用 | 5亿美元（物理学专用） |
| Anthropic | Claude 4 | 0 | 不适用 | 76亿美元（总计） |
| X.AI | Grok-3 | 0 | 不适用 | 60亿美元（总计） |
| Meta | LLaMA-4 | 0 | 不适用 | 0（开源） |

数据要点： OpenAI拥有至少18个月内难以撼动的先发优势。复制这一壮举所需的资本和人才令人咋舌；没有其他公司投入了可与之匹敌的物理学专用预算。

行业影响与市场动态

直接的市场影响是AI公司的价值重估。根据麦肯锡AI部门的内部估计，“发现即服务”（DaaS）市场预计将从今天的0美元增长到2028年的450亿美元。这包括来自制药公司（药物靶点发现）、材料科学（新型晶体结构）和基础物理学（理论生成）的订阅收入。

商业模式转变： OpenAI预计

时间归档

常见问题

这次模型发布“GPT-5 Solves Quantum Gravity: AI Becomes First Non-Human to Produce Verifiable Original Physics”的核心内容是什么？

OpenAI's GPT-5 has achieved what no AI has done before: it has independently produced a novel, mathematically rigorous framework that unifies quantum field theory and general relat…

从“Can GPT-5's quantum gravity theory be tested with current technology?”看，这个模型发布为什么重要？

GPT-5’s breakthrough is not a lucky guess but the result of a fundamental architectural evolution. The model employs a Mixture of Reasoning Experts (MoRE) architecture, a significant departure from the standard transform…

围绕“How does GPT-5's Mixture of Reasoning Experts architecture work?”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。