Momenta CEO曹旭东:L4自动驾驶烧钱100亿美元,现金流才是物理AI的真正入场券

April 2026
physical AI归档:April 2026
Momenta CEO曹旭东在内部演讲中投下重磅炸弹:实现L4规模化需要惊人的100亿美元投入,而海量数据仅占解决方案的10%。他直言,能产生现金流的业务才是进入物理AI时代的真正门票,直接挑战了行业奉为圭臬的“数据为王”逻辑,力推基于自我造血的“适者生存”模式。

在最近的一次内部演讲中,Momenta CEO曹旭东为自动驾驶行业描绘了一幅严峻的图景:要实现L4级别的大规模部署,需要高达100亿美元的资本投入,而海量数据集的价值仅占整体解决方案的10%。这直接挑战了当前行业的主流叙事——即数据规模是核心护城河。相反,曹旭东认为,剩下的90%必须来自算法架构、系统集成、仿真验证的突破,以及最关键的一点——可持续的商业模式。

曹旭东的核心论点是:能够产生正向现金流的业务——例如量产ADAS(高级驾驶辅助系统)合同、Robotaxi车队服务或物流自动化——是进入物理AI时代不可妥协的入场券。

技术深度剖析

曹旭东提出的“海量数据仅占10%”这一论断,直接挑战了自深度学习兴起以来主导自动驾驶领域的“数据中心论”。以Waymo和Cruise为代表的传统观点认为,更多的数据——数十亿英里的真实驾驶里程——是解决长尾边缘案例的关键。但曹旭东认为,原始数据量存在收益递减效应。真正的瓶颈不在于数据数量,而在于数据质量和算法效率。

90%的解决方案:超越数据

根据曹旭东的观点,剩下的90%挑战在于四个相互关联的领域:
1. 算法架构:从模块化流水线(感知→预测→规划)向端到端神经网络的转变。这包括采用基于Transformer的架构、鸟瞰视图(BEV)表示和占用网络。一个关键的开源参考是UniAD代码库(github.com/OpenDriveLab/UniAD),它实现了一个统一的端到端自动驾驶框架。UniAD已获得超过4000颗星,展示了如何将规划直接集成到感知栈中,从而减少错误传播。
2. 系统集成:无缝结合传感器融合(摄像头、LiDAR、雷达)、车辆控制和故障安全机制的能力。这就是工程中“最后10%”的工作往往消耗90%时间的地方。
3. 仿真与验证:使用神经渲染和生成式AI创建逼真、可控的仿真环境。这对于在无真实世界风险的情况下测试罕见事件至关重要。像NuPlan(github.com/motional/nuplan-devkit)和CARLA(github.com/carla-simulator/carla)这样的代码库是基础,但使用扩散模型进行场景生成的新方法正在兴起。
4. 商业模式:从中间产品(例如L2+ ADAS)产生现金流,以资助漫长的L4研发周期。

数据效率 vs. 数据规模

曹旭东提出的10%数字意味着,一个拥有1/10数据但算法好10倍的公司,可以击败一个数据丰富的竞争对手。这与最近关于数据效率的研究一致。例如,特斯拉的FSD V12使用了纯端到端神经网络,据报道,通过利用更高效的架构,其性能与V11持平,但仅使用了后者一小部分的训练数据。

| 方法 | 所需数据(相对值) | 算法复杂度 | 对边缘案例的泛化能力 | 规模化成本 |
|---|---|---|---|---|
| 数据规模主导(例如Waymo) | 100x | 低-中 | 高(通过大规模覆盖) | 极高 |
| 算法高效(例如Momenta论点) | 1x | 高 | 可能更高(通过仿真) | 较低(如果算法有效) |
| 混合型(例如Tesla) | 10x | 高 | 中-高 | 中等 |

数据要点: 该表格说明了核心权衡。数据规模方法已被证明有效,但对大多数参与者来说在财务上不可持续。如果得以实现,算法高效方法提供了一条以更少资本实现L4的路径,但它需要在世界模型和仿真方面取得尚未在大规模上得到验证的突破。

关键参与者与案例研究

曹旭东的论点不仅是理论上的;它反映了Momenta自身的战略以及更广泛的行业动态。

Momenta的双引擎战略

Momenta长期以来一直倡导“双引擎”方法:一个用于L4研发的“数据驱动”引擎,以及一个用于量产ADAS的“收入驱动”引擎。该公司已与上汽、梅赛德斯-奔驰和丰田等主要OEM厂商达成量产协议,提供了稳定的现金流。这直接体现了曹旭东的论点:利用ADAS收入来资助L4的“登月计划”。Momenta面向L2+高速公路和城市导航的“Mpilot”产品线已经在产生收入,而“MSD”(Momenta Self-Driving)栈则瞄准L4 Robotaxi。

竞争策略对比

| 公司 | 主要策略 | 现金流状况 | L4时间线(预估) | 关键优势 |
|---|---|---|---|---|
| Waymo | 数据规模,全栈L4 | 负(由Alphabet资助) | 在选定城市运营 | 先行者,安全记录 |
| Cruise | 数据规模,全栈L4 | 负(由通用汽车资助,已暂停) | 不确定 | 垂直整合 |
| Tesla | 算法高效,纯视觉 | 正(车辆销售 + FSD) | 雄心勃勃但已延迟 | 来自车队的海量数据,成本结构 |
| Momenta | 混合型:ADAS现金流 + L4研发 | 正(来自OEM合同) | 2025-2027(目标) | 收入可持续性,OEM合作伙伴关系 |
| Pony.ai | 全栈L4 + Robotaxi运营 | 负(由风险投资资助) | 在中国运营 | 政府合作伙伴关系 |

数据要点: 该表格揭示了一个明显的分水岭。现金流为负的公司(Waymo、Cruise、Pony.ai)在与时间赛跑,依赖于母公司或投资者的耐心。而特斯拉和Momenta凭借来自其他业务的正向现金流,拥有更长的跑道。曹旭东的论点表明,后一组公司在结构上具有优势。

相关专题

physical AI22 篇相关文章

时间归档

April 20262971 篇已发布文章

延伸阅读

芯片上的世界模型:500 TOPS如何改写自动驾驶规则中国自动驾驶初创公司Qcraft成为首家正式踏入物理AI领域的自动驾驶企业,它将世界模型压缩至仅需500 TOPS车载算力即可运行。这一技术突破直接挑战了行业对云端或数千TOPS硬件的依赖,有望重塑具身智能的成本与可扩展性。How a Table Tennis Robot's Victory Signals Embodied AI's Leap into Dynamic Physical InteractionA table tennis robot has decisively defeated a human professional player, an achievement far more significant than a spoDexWorldModel登顶:AI竞赛从虚拟预测转向物理控制的标志性拐点世界模型基准榜单的一次更迭,揭示了人工智能领域的根本性转向。Crossdim AI的DexWorldModel并非凭借生成更逼真的视频帧夺冠,而是通过展示在指导物理机器人行动方面的卓越性能登顶。这标志着AI能力的真正试金石,正从虚拟预测决定谷歌具身AI突破:赋予机器人空间常识,开启物理智能新范式一类新型AI模型正在弥合数字智能与物理行动之间的鸿沟。通过赋予机器人空间推理与常识,这些系统能让自主智能体解析复杂指令,在现实世界中执行安全、连贯的行动,标志着从脚本化行为到目标驱动智能的范式转变。

常见问题

这次公司发布“Momenta CEO: L4 Autonomy Needs $10B, Cash Flow Is the Real Ticket to Physical AI”主要讲了什么?

In a recent internal presentation, Momenta CEO Cao Xudong laid out a stark vision for the autonomous driving industry: achieving large-scale L4 deployment demands a capital commitm…

从“Momenta L4 autonomous driving cash flow strategy”看,这家公司的这次发布为什么值得关注?

Cao's assertion that 'massive data accounts for only 10%' is a direct challenge to the data-centric paradigm that has dominated autonomous driving since the rise of deep learning. The conventional wisdom, championed by p…

围绕“Cao Xudong 10% data claim analysis”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。