技术深潜
此次发展最令人震惊之处,在于其以受限硬件实现的性能表现。主角理想L6采用双NVIDIA Orin-X配置(总计约200 TOPS),搭配禾赛AT128激光雷达、摄像头和毫米波雷达。在此算力平台上实现可靠的城市NOA功能,标志着行业范式正从“算力密集型”转向“算法精炼型”解决方案——此前业界同类尝试往往需要500-1000+ TOPS算力支撑。
突破归功于“L4算法向下兼容”架构。与传统的、为各ADAS功能单独设计算法的路径不同,由首席科学家余凯领导的理想团队构建了统一的软件栈。其核心是分层规划系统:高层战略决策(路线选择、长期意图)由轻量化模型处理,而计算密集、安全至上的轨迹规划与控制模块,则直接适配自其L4研究车队。这充分利用了在全栈自动驾驶领域(尤其是预测模型)的多年投入。系统采用混合方案:Scene Transformer世界模型用于动态交通参与者的短期高保真预测,MemNet则用于交通流的长期概率预测——两者均从其L4模型蒸馏而来,得以在嵌入式平台上高效运行。
实现此效率的关键是BEV(鸟瞰图)+ Occupancy Network感知范式(该范式由特斯拉推广,现已广泛采用)。系统并非单独处理每个摄像头数据流,而是将多摄像头数据融合为统一的环境3D表征。激光雷达数据在训练阶段充当高精度监督信号,使基于视觉的占用网络能在推理阶段(针对多数任务)不依赖激光雷达的情况下,达到类似激光雷达的精度——这项技术被称为lidar-as-teacher。这降低了实时处理原始点云数据的计算负担。开源社区也在积极探索类似效率提升路径。Comma.ai的OpenPilot项目展示了在消费级硬件上端到端学习的潜力;而上海人工智能实验室的UniAD(Unified Autonomous Driving)等学术仓库,则提供了集成感知、预测与规划的模块化框架,其多任务学习方法已吸引研究者点出超过3,000颗星。
| 系统组件 | 传统方案(高算力型) | 新型高效方案(类理想L6) | 核心创新点 |
|---|---|---|---|
| 感知 | 摄像头/激光雷达/毫米波雷达独立处理管线,重度点云处理 | 统一的BEV + Occupancy网络,训练阶段采用lidar-as-teacher | 减少实时融合计算量;借助激光雷达提升精度却无需承担运行时成本 |
| 预测 | 基于规则或简单机器学习模型 | 从L4模型蒸馏而来的Scene Transformer + MemNet | 以更少算力实现精准的多智能体轨迹预测 |
| 规划 | 模块化、串行式管线 | 分层规划,运动规划器源自L4技术 | 复用经过验证的、来自自动驾驶研究的鲁棒规划代码 |
| 计算平台 | 500-1000+ TOPS(例如双Orin-X加额外芯片) | ~200 TOPS(双Orin-X) | 算法效率使得低阶硬件也能承载高阶功能 |
数据启示: 上表揭示了智能驾驶技术栈的根本性再平衡。创新重心已决定性从硬件(追求更高TOPS)转向软件架构与算法蒸馏,使得实现类似城市NOA功能所需算力降低60-80%。
关键参与者与案例研究
此番变革由理想汽车主导。这家公司始终专注于搭载增程电动的家庭SUV,其策略一直是务实商业化:在保持高毛利的同时逐步引入先进功能。理想L6代表了一次大胆的偏离——牺牲硬件毛利以抢占市场份额,并确立其理想AD软件为默认标准。CEO李想已明确表示,公司未来的盈利能力将日益依赖软件订阅与服务。
压力立即传导至供应商端。激光雷达供应商禾赛科技在降本方面取得了微小奇迹。其AT128混合固态激光雷达,曾是需要1000美元以上的部件,如今据传因大规模量产和制造优化设计,供应成本已降至原价的零头。竞争对手如RoboSense正竞相推出更便宜的M系列激光雷达。在芯片侧,地平线的Journey 5芯片(128 TOPS)与黑芝麻智能的A1000芯片,正在为英伟达Orin提供具有竞争力的替代方案,承诺更高的性价比以及与感知算法的更深层集成。
然而,真正的颠覆者在于算法层面的策略。