技术深度剖析
曹旭东提出的“海量数据仅占10%”这一论断,直接挑战了自深度学习兴起以来主导自动驾驶领域的“数据中心论”。以Waymo和Cruise为代表的传统观点认为,更多的数据——数十亿英里的真实驾驶里程——是解决长尾边缘案例的关键。但曹旭东认为,原始数据量存在收益递减效应。真正的瓶颈不在于数据数量,而在于数据质量和算法效率。
90%的解决方案:超越数据
根据曹旭东的观点,剩下的90%挑战在于四个相互关联的领域:
1. 算法架构:从模块化流水线(感知→预测→规划)向端到端神经网络的转变。这包括采用基于Transformer的架构、鸟瞰视图(BEV)表示和占用网络。一个关键的开源参考是UniAD代码库(github.com/OpenDriveLab/UniAD),它实现了一个统一的端到端自动驾驶框架。UniAD已获得超过4000颗星,展示了如何将规划直接集成到感知栈中,从而减少错误传播。
2. 系统集成:无缝结合传感器融合(摄像头、LiDAR、雷达)、车辆控制和故障安全机制的能力。这就是工程中“最后10%”的工作往往消耗90%时间的地方。
3. 仿真与验证:使用神经渲染和生成式AI创建逼真、可控的仿真环境。这对于在无真实世界风险的情况下测试罕见事件至关重要。像NuPlan(github.com/motional/nuplan-devkit)和CARLA(github.com/carla-simulator/carla)这样的代码库是基础,但使用扩散模型进行场景生成的新方法正在兴起。
4. 商业模式:从中间产品(例如L2+ ADAS)产生现金流,以资助漫长的L4研发周期。
数据效率 vs. 数据规模
曹旭东提出的10%数字意味着,一个拥有1/10数据但算法好10倍的公司,可以击败一个数据丰富的竞争对手。这与最近关于数据效率的研究一致。例如,特斯拉的FSD V12使用了纯端到端神经网络,据报道,通过利用更高效的架构,其性能与V11持平,但仅使用了后者一小部分的训练数据。
| 方法 | 所需数据(相对值) | 算法复杂度 | 对边缘案例的泛化能力 | 规模化成本 |
|---|---|---|---|---|
| 数据规模主导(例如Waymo) | 100x | 低-中 | 高(通过大规模覆盖) | 极高 |
| 算法高效(例如Momenta论点) | 1x | 高 | 可能更高(通过仿真) | 较低(如果算法有效) |
| 混合型(例如Tesla) | 10x | 高 | 中-高 | 中等 |
数据要点: 该表格说明了核心权衡。数据规模方法已被证明有效,但对大多数参与者来说在财务上不可持续。如果得以实现,算法高效方法提供了一条以更少资本实现L4的路径,但它需要在世界模型和仿真方面取得尚未在大规模上得到验证的突破。
关键参与者与案例研究
曹旭东的论点不仅是理论上的;它反映了Momenta自身的战略以及更广泛的行业动态。
Momenta的双引擎战略
Momenta长期以来一直倡导“双引擎”方法:一个用于L4研发的“数据驱动”引擎,以及一个用于量产ADAS的“收入驱动”引擎。该公司已与上汽、梅赛德斯-奔驰和丰田等主要OEM厂商达成量产协议,提供了稳定的现金流。这直接体现了曹旭东的论点:利用ADAS收入来资助L4的“登月计划”。Momenta面向L2+高速公路和城市导航的“Mpilot”产品线已经在产生收入,而“MSD”(Momenta Self-Driving)栈则瞄准L4 Robotaxi。
竞争策略对比
| 公司 | 主要策略 | 现金流状况 | L4时间线(预估) | 关键优势 |
|---|---|---|---|---|
| Waymo | 数据规模,全栈L4 | 负(由Alphabet资助) | 在选定城市运营 | 先行者,安全记录 |
| Cruise | 数据规模,全栈L4 | 负(由通用汽车资助,已暂停) | 不确定 | 垂直整合 |
| Tesla | 算法高效,纯视觉 | 正(车辆销售 + FSD) | 雄心勃勃但已延迟 | 来自车队的海量数据,成本结构 |
| Momenta | 混合型:ADAS现金流 + L4研发 | 正(来自OEM合同) | 2025-2027(目标) | 收入可持续性,OEM合作伙伴关系 |
| Pony.ai | 全栈L4 + Robotaxi运营 | 负(由风险投资资助) | 在中国运营 | 政府合作伙伴关系 |
数据要点: 该表格揭示了一个明显的分水岭。现金流为负的公司(Waymo、Cruise、Pony.ai)在与时间赛跑,依赖于母公司或投资者的耐心。而特斯拉和Momenta凭借来自其他业务的正向现金流,拥有更长的跑道。曹旭东的论点表明,后一组公司在结构上具有优势。