自动驾驶是通往物理AI的门票:Momenta CEO的颠覆性论断

April 2026
physical AIautonomous drivingworld model归档:April 2026
Momenta CEO曹旭东抛出一个范式级论断:自动驾驶不是终点,而是物理AI的序章。他认为,实现正向现金流业务是进入物理AI竞技场不可妥协的门票。AINews深度解析这一大胆论断背后的商业逻辑与技术路线图。

在近期一场行业演讲中,Momenta CEO曹旭东重新定义了整个自动驾驶叙事。他指出,该领域本身并非终极目标,而是物理AI的“序章”——机器与现实世界交互中最复杂、最具商业可行性的应用。其核心论点是:一个可持续、正向现金流的业务,是资助训练世界模型所需的海量算力、传感器和仿真基础设施的前提。没有这张“门票”,企业无法负担破解通用物理智能所需的漫长而昂贵的研发周期。这种“以战养战”的策略表明,物理AI的赢家不会是那些拥有最炫酷演示的公司,而是那些率先在真实道路上实现盈利运营的企业。这一洞察直接挑战了行业盛行的“烧钱换规模”逻辑,为自动驾驶商业化提供了全新的思考框架。

技术深度解析

曹旭东的论断建立在一个特定的技术现实之上:构建一个世界模型——一个理解物理、因果和3D几何的AI——需要巨大且持续的数据飞轮。自动驾驶汽车恰好能提供这一点。它们是移动的传感器平台,每天生成PB级的多模态数据(LiDAR、雷达、摄像头、IMU),捕捉那些无法通过仿真真实复现的边缘案例和罕见事件。

其核心架构是Momenta一直倡导的端到端神经网络方法。与将感知、预测、规划和控制分离的模块化流水线不同,端到端模型直接输入原始传感器数据并直接输出驾驶指令。这需要一个能够推理被遮挡物体、预测行人意图并处理长尾场景的“世界模型”。训练这样的模型需要:

1. 海量计算集群: 训练单个端到端模型在GPU时间上的成本可能高达数千万美元。一个正向现金流的ADAS业务可以直接为此提供资金。
2. 高保真仿真: 为了生成罕见事件(例如,一个孩子追着球跑上街道)的合成数据,公司需要基于物理的仿真器。Momenta使用自己的仿真引擎,该引擎通过真实驾驶日志持续验证。
3. 数据引擎: 一个闭环系统,部署车辆收集数据,然后从中挖掘有趣的场景,进行标注(通常自动完成),并反馈到训练流水线中。这就是只有在规模化下才能运作的“数据飞轮”。

一个关键的开源参考点是UniAD(统一自动驾驶)项目,它开创了一种面向规划的端到端模型。虽然不直接属于Momenta,但它代表了架构方向。该仓库(github.com/OpenDriveLab/UniAD)已获得超过3000颗星,展示了基于Transformer的架构如何统一感知、预测和规划。另一个相关的仓库是BEVFormer(github.com/fundamentalvision/BEVFormer),它使用鸟瞰视角Transformer来融合多摄像头数据——这一技术现已成为生产系统的标准。

| 模型/方法 | 架构 | 数据需求 | 计算成本(训练) | 真实世界验证 |
|---|---|---|---|---|
| 模块化流水线 | 分离的感知/预测/规划 | 约100万张标注图像 | 50万 - 200万美元 | 高(已部署于许多自动驾驶车辆) |
| 端到端(例如UniAD) | 统一Transformer | 1000万+多样化场景 | 500万 - 2000万美元 | 有限(主要为研究) |
| 世界模型(例如GAIA-1) | 生成式视频预测 | 1亿+小时驾驶数据 | 5000万美元以上 | 实验性 |

数据要点: 表格显示,物理AI所需的端到端和世界模型方法,其数据和计算需求比传统模块化系统高出一个数量级。只有拥有盈利且大规模部署(如Momenta的ADAS业务)的公司才能可持续地为此提供资金。

关键玩家与案例分析

Momenta在这场竞赛中并不孤单,但其策略独树一帜。关键玩家可以根据其对“门票”的处理方式分类:

- Momenta(中国): “门票优先”的倡导者。它向上汽、比亚迪和梅赛德斯-奔驰等OEM销售“Mona”(入门级ADAS)。这产生了收入和数据。其“Mpilot”(全自动驾驶)是长期目标。该公司已从包括上汽、通用汽车和丰田在内的投资者处筹集了超过10亿美元。其估值估计超过100亿美元。
- Waymo(美国): “全自动驾驶优先”的方法。Waymo已投入数十亿美元,但尚未找到明确的盈利路径。其收入来自Robotaxi车费,但成本(传感器、安全驾驶员、地图)仍然很高。它缺乏一个低成本的ADAS产品来产生现金流。
- 特斯拉(美国): “软件优先”的方法。特斯拉以订阅方式销售FSD(完全自动驾驶),产生高利润收入。其数百万辆汽车的庞大车队提供了无与伦比的数据优势。然而,FSD尚未实现真正的自动驾驶,其“纯视觉”方法存在局限性。
- 华为(中国): “Tier-1供应商”的方法。华为向OEM(例如问界、阿维塔)提供全栈解决方案。其电信业务资金雄厚,可以补贴自动驾驶研发。它是Momenta在中国的直接竞争对手。

| 公司 | 收入模式 | 现金流状况 | 数据量(年估) | 关键优势 | 关键风险 |
|---|---|---|---|---|---|
| Momenta | ADAS授权 + Robotaxi | 正向(来自ADAS) | 约1亿公里 | 资本效率,OEM合作伙伴关系 | 依赖中国市场 |
| Waymo | Robotaxi车费 | 负向(每年约50亿美元亏损) | 约5000万公里 | 技术领先,美国市场 | 不可持续的烧钱速度 |
| 特斯拉 | FSD订阅 | 正向(汽车销售) | 约10亿公里 | 庞大车队数据 | FSD尚未达到L4 |
| 华为 | 全栈解决方案 | 正向(电信业务) | 约2亿公里 | 资金雄厚,中国政府关系 | 地缘政治风险 |

数据要点: Momenta是唯一一家在自动驾驶领域实现正向现金流的公司,这使其在通往物理AI的竞赛中占据了独特的财务优势。

相关专题

physical AI20 篇相关文章autonomous driving24 篇相关文章world model29 篇相关文章

时间归档

April 20262510 篇已发布文章

延伸阅读

2026北京车展:自动驾驶迎来终极商业化大考2026年北京国际汽车展览会将不再只是未来科技的秀场,而将蜕变为自动驾驶商业化落地的核心试炼场。行业焦点已从硬件参数与概念演示,彻底转向可规模化产品、可持续商业模式与真实城市部署。本届盛会将揭示哪些企业真正完成了从技术到商业的惊险一跃。腾讯生态整合,自动驾驶商业化竞赛迎来关键转折自动驾驶行业的竞争格局正在重塑。科技巨头腾讯与领先自动驾驶公司小马智行的里程碑式合作,远不止一笔投资——它标志着行业从技术冲刺转向生态竞争的根本性转变。芯片上的世界模型:500 TOPS如何改写自动驾驶规则中国自动驾驶初创公司Qcraft成为首家正式踏入物理AI领域的自动驾驶企业,它将世界模型压缩至仅需500 TOPS车载算力即可运行。这一技术突破直接挑战了行业对云端或数千TOPS硬件的依赖,有望重塑具身智能的成本与可扩展性。DeepSeek V4 颠覆AI经济学:推理成本直降40%、视频生成原生集成,算力霸权终结DeepSeek V4 不仅仅是一次模型迭代,它是对AI经济模式的一纸宣战书。通过将推理成本削减40%,同时将视频生成与世界模拟整合进单一框架,V4重新定义了开源模型的能力边界,并宣告了“算力即性能”时代的终结。

常见问题

这次公司发布“Autonomous Driving Is the Ticket to Physical AI: Momenta CEO's Bold Thesis”主要讲了什么?

In a recent industry talk, Momenta CEO Cao Xudong reframed the entire autonomous driving narrative. He posited that the field is not an end in itself but the 'prologue' to physical…

从“Momenta CEO Cao Xudong physical AI thesis explained”看,这家公司的这次发布为什么值得关注?

Cao's thesis rests on a specific technical reality: building a world model—an AI that understands physics, causality, and 3D geometry—requires an immense and continuous data flywheel. Autonomous vehicles are uniquely pos…

围绕“Momenta business model ADAS cash flow positive”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。