技术深度解析
滴滴的三支柱战略代表了一种精密的工程哲学,其中每个组件都被设计为能强化其他组件。AI支柱正从传统的模块化流水线(感知→预测→规划)向端到端神经架构演进,更重要的是,向世界模型的开发迈进。世界模型是AI系统对其环境的内在模拟,使其能够预测未来状态,并在无需直接经验的情况下推理行动的后果。对于自动驾驶而言,这意味着从被动响应转向主动且具有社会意识的驾驶行为。以首席科学家吴甘沙等科学家为代表的滴滴研究团队,已发表了关于多模态感知与预测模型的研究,这些模型融合激光雷达、摄像头和雷达数据,以理解长尾场景。一个关键的技术成果是`DIDI-Research/Scene-Graph-Prediction`,这是一个GitHub项目,专注于利用动态场景图对多个交通参与者进行更精确的长时程轨迹预测,其编码复杂城市交互的新颖方法已引起广泛关注。
硬件支柱旨在为这种智能创建一个确定性的物理平台。这涉及深度的垂直整合,从传感器选型与布置到中央计算单元的设计。滴滴正在开发其自有的DiDi Auto Brain计算平台,该平台很可能采用异构架构,将用于AI推理的高性能GPU与用于传感器融合和确定性控制任务的专用ASIC或FPGA相结合。目标是在管理热、功耗和成本约束的同时,实现汽车级可靠性(ASIL-D)。传感器套件正针对特定的运行设计域进行优化;例如,一辆部署在复杂城市十字路口的Robotaxi,可能比在简单地理围栏高速公路路线上运行的车辆搭载分辨率更高的激光雷达。
| 能力维度 | 传统模块化方案 | 滴滴的集成支柱方案 |
|---|---|---|
| AI核心 | 检测、跟踪、预测使用独立模型。规划基于规则或优化驱动。 | 向端到端神经运动规划和用于因果推理的世界模型演进。 |
| 数据利用 | 基于精选数据集进行离线训练。针对边缘案例使用仿真。 | 从实时运营的网约车车队中持续在线学习,形成真实世界数据飞轮。 |
| 硬件重点 | 商用传感器 + 强大的通用计算平台(如NVIDIA Drive)。 | 定制化传感器标定/融合 + 面向特定领域的计算平台(DiDi Auto Brain)以提升效率。 |
| 验证指标 | 接管率、每次干预行驶里程。 | 服务级指标:系统可用率、乘客满意度、单均成本、十亿英里安全表现。 |
数据要点: 上表展示了从评估独立技术能力,向优化集成系统性能和商业服务指标的范式转变。滴滴的战略明确地将技术选择与商业成果挂钩。
关键参与者与案例研究
自动驾驶领域正分化为两大阵营:以滴滴、Waymo和Cruise为代表的全栈服务集成商,以及以Mobileye、NVIDIA和百度Apollo(在其供应商模式下)为代表的技术供应商。滴滴的战略将其牢固地置于第一阵营,直接与Waymo长达十年构建集成出行服务的专注、以及Cruise对高密度城市部署的推进展开竞争。
Waymo 在纯技术层面展示了黄金标准,自动驾驶里程已超过2000万英里。然而,其规模化进程严谨且资本密集,严重依赖精心绘制和模拟的高精地图世界。Cruise 在旧金山激进地挑战高密度城市复杂性,但遭遇了严重的监管和运营挫折,凸显了技术扩张速度超过运营安全与公众信任建立速度所带来的风险。滴滴的差异化因素在于其嵌入式市场地位。与必须从零开始构建用户基础的Waymo或Cruise不同,滴滴理论上可以将自动驾驶车辆接入其拥有数亿用户的现有App,并从一开始就利用其成熟的路径规划和订单匹配算法来管理供需。
在中国,竞争对手包括同时运营Robotaxi服务(Apollo Go)和供应商业务的百度Apollo,以及专注于Robotaxi和卡车业务的小马智行。AutoX 以其激进地取消安全员的立场而引人注目。滴滴基于场景的方法,正是对“一个模型适应所有场景”挑战的直接回应。例如,通过首先攻克北京首都国际机场这条高需求、相对结构化的路线,滴滴可以快速提供可靠服务、产生收入并建立公众认知,同时收集特定ODD下的密集数据,以进一步迭代和优化其系统,为更复杂场景的拓展奠定基础。