技术深度解析
零跑宣称的核心创新在于为自主代客泊车开发的“高效世界模型”。在学术与产业研究中,世界模型是一种通过学习获得的环境内部表征,能够模拟未来状态。它将高维度的感官输入(摄像头图像、雷达点云)压缩至低维度的潜在空间,从而以更低的计算成本进行规划与预测。
传统的代客泊车等自动驾驶功能栈,严重依赖实时、高精度的感知系统。它们利用强大的神经网络进行目标检测、分割与跟踪,并持续在NVIDIA Orin或高通Snapdragon Ride等专用AI加速器上运行。这种“暴力计算”方案虽有效,但在芯片成本、功耗与热管理方面代价高昂。
零跑提出的高效世界模型可能遵循了不同范式:
1. 稀疏、事件驱动的感知:系统可能不会以全分辨率处理每一帧摄像头图像,而是仅在检测到相关变化(如移动的行人、倒车的车辆)时才触发详细分析。这降低了持续的计算负荷。
2. 拓扑建图与记忆:系统很可能构建并维护停车场结构的轻量化拓扑地图——记忆关键地标、车道几何形状和空车位位置——而非每次从头执行完整的SLAM(同步定位与建图)。这种“记忆”能力使得后续访问时能进行更简单的定位与路径规划。
3. 低精度预测建模:“世界模型”组件学习停车场内的常见模式(如电梯厅附近的行人路径、购物车归还区)。通过预测可能的未来状态,车辆可以规划更平顺、更具预见性的轨迹,而无需对每个刺激都做出毫秒级反应。
4. 软硬件协同设计:该系统几乎肯定是围绕一款特定的、成本优化的系统级芯片(SoC)设计的,可能来自地平线或黑芝麻智能等中国供应商。算法针对该硬件的优势与局限进行定制,避免其不擅长的运算。
一个探索类似原理的相关开源项目是 `world-models`(GitHub: `worldmodels/worldmodels`),最初由David Ha和Jürgen Schmidhuber提出。该仓库演示了如何训练循环神经网络,在压缩的潜在空间中模拟环境动态。虽然并非直接用于汽车,但它体现了核心理念:学习压缩的时空表征以实现更高效的规划。更应用导向的研究可见于如 `nuPlan`(GitHub: `motional/nuPlan`)等项目,这是一个大规模规划基准,其中预测与规划模型的效率是关键研究指标。
| 方案 | 典型硬件成本(估算) | 计算能力 | 关键局限 |
|---|---|---|---|
| 高算力方案(如NVIDIA Drive Orin) | 1,500 - 2,500+ 美元 | 250+ TOPS | 成本高、功耗大、热管理需求高。 |
| 高效世界模型(零跑宣称) | 200 - 500 美元 | 10-50 TOPS | 在高度新颖或极端案例场景中可能表现脆弱;严重依赖模型泛化能力。 |
| 传统基于规则的自动泊车 | 100 - 300 美元 | <5 TOPS | 适用范围极其有限;在动态或非结构化环境中失效。 |
数据要点:上表展示了计算硬件成本的数量级差异。零跑的方案瞄准了低成本、简单的基于规则系统与昂贵、通用的AI计算平台之间的性能空白,旨在以接近入门级的硬件成本提供高级功能。
关键参与者与案例分析
零跑并非在真空中运作。其战略直接回应了行业领导者设定的主流趋势。
* 特斯拉:纯视觉、AI中心化方案的典型代表。然而,特斯拉的全自动驾驶(FSD)系统尽管效率不断提升,仍依赖强大的车载算力(硬件3.0/4.0),并且作为高利润的软件升级选项提供(美国售价1.2万美元以上)。特斯拉大力投入“视频世界模型”(常被称为“占据网络”)以预测3D几何,但其服务于通用自动驾驶目标,而非成本受限的特定场景。
* 小鹏汽车:中国市场的直接竞争对手,以代客泊车辅助(VPA)等高级泊车功能闻名。小鹏通常将这些功能与强大的传感器套件(部分车型配备激光雷达)及可观算力相结合,将其定位为高端差异化卖点。
* 地平线与黑芝麻智能:这些中国AI芯片制造商是关键赋能者。他们生产成本优化的SoC(如地平线的征程系列),在每瓦特性能和每美元性能上具备竞争力。零跑的架构很可能围绕此类芯片构建。