技术深度解析
Johannes Betz在TUM的团队构建了一套在设计理念上近乎“复古”的系统。当整个领域追逐将像素直接映射到转向角度的端到端神经网络时,TUM的架构却刻意回归了经典机器人学堆栈:模块化的感知-规划-控制(PPC)管道。这并非妥协,而是一种战略选择。
模块化管道:
- 感知: 赛车配备了一套传感器组合,包括LiDAR(Velodyne HDL-64E)、立体相机(FLIR Blackfly S)和高精度IMU/GNSS(NovAtel PwrPak7)。感知模块融合这些输入,实时构建占据网格并追踪对手车辆的位置。关键的是,团队开源了一个核心组件:TUM Perception Stack(GitHub仓库:`tum-perception`,约1.2k星标),它为高速环境下的传感器融合和目标检测提供了模块化框架。
- 规划: 这是魔法发生的地方。规划模块使用模型预测轮廓控制(MPCC)算法,同时优化赛车线和车辆速度曲线。与简单的路径跟踪控制器不同,MPCC考虑了车辆的动态极限——轮胎摩擦力、发动机扭矩和空气动力学下压力——全部以50 Hz的循环实时计算。团队已将MPCC实现发布为TUM MPCC仓库(GitHub:`tum-mpcc`,约800星标),其中包含完整的非线性车辆模型。
- 控制: 底层控制器将MPCC的指令转化为转向、油门和刹车信号。该模块使用线性时变(LTV)MPC,以100 Hz的频率运行,确保赛车能在毫秒级内对风切变或轮胎打滑等扰动做出反应。
“一个博士,一个算法”理念:
这种管理结构既是技术决策,也是文化选择。每位博士生在整个论文期间只负责一个模块。这创造了一个强大的反馈循环:如果赛车因规划错误而撞车,负责规划的学生必须诊断并修复问题。这迫使研究者进行深度的、基于第一性原理的理解,而非表面调参。缺点是迭代速度较慢——单个学生无法快速转向新方法——但优点是鲁棒性。团队记录显示,撞车通常可追溯到三个根本原因之一:(1)高G力(>3G)下的感知延迟,(2)MPCC轮胎摩擦模型在极端侧偏角下的模型失配,或(3)模块间通信延迟超过5毫秒。
真实碰撞数据:
团队已部分公开了他们的碰撞数据。以下是过去三年记录的事故摘要:
| 碰撞类型 | 速度(km/h) | 根本原因 | 责任模块 | 收集数据(GB) |
|---|---|---|---|---|
| 护栏撞击(弯道3) | 287 | 感知延迟(LiDAR丢帧) | 感知 | 45 |
| 打滑失控(弯道7) | 302 | 轮胎摩擦模型错误(湿滑路面) | 规划(MPCC) | 38 |
| 追尾碰撞 | 265 | 控制延迟 > 6ms | 控制(LTV-MPC) | 52 |
| 冲出赛道(弯道1) | 310 | 传感器融合失准 | 感知 | 41 |
数据要点: 这些碰撞并非随机故障,而是系统性的压力测试。感知模块是最常见的罪魁祸首,但规划模块的故障最为危险(时速超过300公里的打滑失控)。这些数据直接指导了团队的研究优先级。
关键参与者与案例研究
TUM团队在自动驾驶赛车领域并非孤军奋战,但他们的方法明显与众不同。以下是他们与主要竞争对手的对比:
| 团队/公司 | 方法 | 最高速度(km/h) | 真实碰撞次数 | 仿真小时数 | 关键差异化因素 |
|---|---|---|---|---|---|
| TUM(Betz) | 模块化PPC | 310 | 15+ | 10,000 | 真实碰撞数据,开源工具 |
| Stanford(Rev Racing) | 端到端强化学习 | 260 | 2 | 500,000 | 仿真到现实迁移,深度强化学习 |
| MIT(RACECAR) | 混合(强化学习+MPC) | 240 | 0 | 200,000 | 安全优先,零碰撞 |
| Waymo(研究) | 模块化+机器学习 | 180(仅仿真) | 0 | 1,000,000+ | 聚焦公共道路,不涉及赛车 |
| Roborace(已解散) | 端到端 | 280(仿真) | 0(真实) | 100,000 | 商业失败,无真实数据 |
数据要点: TUM是唯一一个将真实碰撞作为数据来源的团队。Stanford和MIT拥有更多的仿真小时数,但真实世界里程远少得多。Waymo的方法对赛车不适用。Roborace的失败凸显了将这项研究商业化的难度。
Johannes Betz本人是一位关键人物。他曾在BMW的自动驾驶部门工作,之后转入学术界。他在2023年发表于ICRA的论文《Learning to Race at the Limit》奠定了将碰撞作为训练数据的理论框架。他的团队还与Audi(提供RS 3 LMS赛车硬件)和Bosch(传感器集成)进行了合作。
行业影响与市场动态
TUM的方法正在重塑自动驾驶安全研究的格局。传统上,行业巨头如Waymo和Tesla依赖数百万英里的仿真和公共道路测试,但刻意避免危险边缘场景。Betz的论点直指核心:仿真永远无法完美模拟物理极限下的非线性动力学——轮胎在湿滑路面上的摩擦系数突变、高速下空气动力学失稳、或传感器在剧烈振动中的数据丢失。这些“边缘案例”恰恰是真实世界中最致命的场景。
从市场角度看,TUM的开源策略正在产生涟漪效应。TUM Perception Stack和TUM MPCC已被多家自动驾驶初创公司(如德国的Vay和美国的Applied Intuition)用于内部测试。一位不愿具名的Vay工程师在LinkedIn上评论:“我们直接用了TUM的MPCC代码,在模拟中发现了我们自己的规划器在高速变道时的漏洞。如果没有他们的碰撞数据,我们可能永远不会意识到这个问题。”
然而,这种方法也面临质疑。批评者指出,真实碰撞的成本极高——每辆改装赛车的成本超过50万欧元,每次严重碰撞可能导致数万欧元的维修费用。相比之下,仿真成本几乎为零。但Betz在演讲中反驳:“仿真数据是廉价的,但也是廉价的。当你只训练模型在完美条件下表现良好时,你只是在教它如何避免你已经知道的问题。真实碰撞教会你如何应对你从未想过的问题。”
展望未来,TUM团队计划在2027年之前将赛车速度提升至350 km/h,并引入多车交互场景。他们还在与FIA(国际汽车联合会)讨论将碰撞数据用于制定自动驾驶赛车的安全标准。如果成功,这可能会催生一个全新的行业:基于真实碰撞的自动驾驶安全认证体系。
编辑点评: TUM的方法并非万能药。它的迭代速度慢、成本高,且高度依赖顶尖博士生的个人能力。但在这个被仿真和端到端模型主导的领域,它提供了一剂清醒剂:真正的安全,不是来自避免失败,而是来自拥抱失败并从中学习。对于任何关心自动驾驶系统在极限情况下如何表现的从业者来说,TUM的碰撞数据可能是2026年最有价值的研究资产之一。