技术深度解析
亦庄马拉松如同一场对具身AI技术栈的现场解剖,揭示了在持续、非结构化的压力下,各组件间的衔接如何变得脆弱。核心挑战在于将感知、状态估计、控制和规划整合成一个连贯、容错的系统。
感知与世界建模: 在实验室中,环境通常被预先测绘,传感器数据干净。而在马拉松赛道上,机器人面临着影响摄像头的阳光眩光、干扰IMU数据的振动,以及不断变化的视野。这暴露了依赖精确预编程或有限环境假设的系统之脆弱性。以苏黎世联邦理工学院机器人系统实验室等团队的研究为代表的前沿方法,涉及实时构建概率世界模型。这些模型不仅映射静态障碍物,还估算表面属性(光滑度、柔韧性)并预测动态变化。推动这一前沿的关键开源项目是`facebookresearch/theseus`,这是一个用于可微分优化的库,使机器人能够直接从传感器数据中学习几何和物理模型,从而实现更具适应性的落脚点规划。然而,亦庄赛事表明,推理速度仍是关键瓶颈——足够准确识别松散石块的模型,其计算速度往往不足以防止绊倒。
控制与运动: 马拉松是对模型预测控制和强化学习训练策略的严酷考验。大多数竞争平台采用混合方案:RL通过数百万次模拟试验来学习稳健的“动作库”和恢复策略,而MPC则根据当前状态估计实时微调这些动作。机器人的踉跄揭示了这些策略在训练分布边界上的失效点:一个主要在平坦或轻微不平坦地形上训练的策略,缺乏应对突然出现的深裂缝的“想象力”。这加速了仿真到现实迁移和领域随机化方面的工作。像`google-deepmind/mujoco_menagerie`(包含许多机器人的精确仿真模型)和`NVlabs/IsaacGym`(支持大规模并行RL训练)这样的代码库是关键工具。来自亦庄失败案例的数据正被反馈到这些仿真中,以针对更极端的边缘情况进行随机化训练。
能效与续航: 马拉松从根本上说是一场效率挑战。下表比较了领先平台的预估关键指标,突出了动态性能与运行续航之间的权衡,这是现实世界部署的关键因素。
| 平台(类型) | 预估运动功耗 | 典型电池容量 | 预估运行距离(类似亦庄赛道) | 核心运动方案 |
|---|---|---|---|---|
| Boston Dynamics Atlas(双足) | 1500-2000W(高扭矩液压) | ~3.7 kWh | ~2-3 km | 基于模型的MPC,高动态性 |
| Agility Robotics Digit(双足) | 400-700W(电动) | ~2.5 kWh | ~5-8 km | RL训练策略 + MPC,效率优化 |
| Unitree H1(双足) | 500-800W(电动) | ~3 kWh | ~4-7 km | 混合RL/MPC,成本导向 |
| ANYmal C(四足) | 200-400W(小跑) | ~4 kWh | ~10-12 km | RL策略,静态稳定性 |
数据启示: 马拉松强调,目前动态的、类人的双足运动(如Atlas)需要付出显著的能耗代价。对于物流或巡检等优先考虑续航而非杂技能力的应用,四足机器人和像Digit这样效率优化的双足机器人具有明显的续航优势。赢得马拉松需要为后者优化,这直接影响了商业设计的优先级。
关键参与者与案例研究
亦庄赛事是主要参与者的战略展示场,各自不同的理念正在公开场合接受压力测试。
Agility Robotics 与“工人”哲学: Agility的Digit表现出显著的稳定性,体现了为实用性而生的设计优先理念。其反曲膝关节的步态虽然拟人化程度较低,但提供了固有的稳定性和能量回收能力。CEO Jonathan Hurst一直将Digit定位为“机器人工人”,优先考虑货物搬运、跨越台阶和长时间运行,而非动态炫技。亦庄赛事验证了这种专注于耐力的应用方向。他们的策略涉及硬件和软件的深度垂直整合,并与GXO Logistics建立了旗舰合作伙伴关系,在仓库进行试点。
Boston Dynamics 与“运动员”范式: 波士顿动力的Atlas虽非官方参赛者,却代表了动态运动能力的巅峰。其液压驱动实现了惊人的力量和平衡表现。然而,马拉松场景凸显了其潜在缺点:复杂性、成本、噪音和能耗。在现代汽车集团控股后,公司的重心转向商业化Spot(四足)和Stretch(仓库机械臂),这表明其战略正在从纯粹的研发炫技向可规模化的商业解决方案调整。Atlas所代表的技术巅峰,在亦庄的语境下,更像是一个技术灯塔,而非即用型产品蓝图。