全身AI控制:机器人如何通过精密任务学会跳舞

June 2026
reinforcement learningworld model归档:June 2026
多年来,机器人的灵巧性一直被视为一个“手部问题”。一项新突破证明,真正的瓶颈在于整个身体。一个统一的神经网络模型如今在单一控制回路中协调腿、腰、臂和手指,使机器人能像人类工匠一样转移重心和调整姿态。这标志着从孤立肢体控制到整体运动智能的根本性转变。

机器人学界长期以来一直将改进夹爪、触觉传感器和手指级控制视为实现灵巧操作的关键路径。但一项由顶尖机器人实验室主导、并最终以里程碑式演示呈现的日益增长的研究揭示了一个反直觉的真相:手部性能从根本上受限于身体提供稳定、自适应机械基础的能力。这一突破——AINews已进行独立分析——涉及一个同时控制人形机器人腿、腰、臂和手的单一神经网络。通过在学习到的世界模型内进行强化学习训练,机器人学会了动态调整其站姿、倾斜角度和手臂配置,从而为手部执行精细任务(如插销入孔)创造最佳条件。

技术深度解析

核心创新在于一个统一的神经网络策略,它将高维感官输入——关节位置、扭矩、IMU数据和视觉——直接映射到所有自由度(DoF)的电机指令上。这与经典方法形成鲜明对比:一个运动控制器(例如用于行走的模型预测控制)、一个独立的平衡控制器(例如用于躯干稳定的逆动力学)以及一个操作规划器(例如用于手臂和手的轨迹优化)。

架构: 该模型是一个深度循环神经网络(很可能是Transformer或LSTM变体),通过基于模型的强化学习(MBRL)进行训练。它使用一个学习到的世界模型——一个根据当前状态和动作预测下一状态的神经网络——在物理模拟器(如Isaac Gym或MuJoCo)中模拟数千年的经验。世界模型使策略能够“想象”其动作的后果,从而实现对复杂全身协调的高效样本学习。奖励函数经过精心设计:包括任务完成度(例如插销深度)、能效(扭矩最小化)、稳定性(质心投影在支撑多边形内)和平滑度(惩罚加加速度)等项。

关键工程洞察: 该策略并未明确区分“平衡”和“操作”。相反,它学会了向后移动臀部并稍微弯曲膝盖可以为手臂施加侧向力创造更稳定的基础。这种涌现行为——利用腿部作为配重——是任何模块化控制器都无法发现的。

相关开源工作: 最接近的公开仓库是GitHub上的“Whole-Body Control via Task-Space Decomposition”项目(约1,200星),它提供了一个使用二次规划结合运动与操作的框架。然而,新方法更进一步,用学习到的策略取代了优化层。另一个相关仓库是“Isaac Gym Reinforcement Learning”(NVIDIA,4,500+星),它提供了用于训练此类策略的模拟基础设施。

性能数据: 下表将新的全身策略与传统模块化控制在人形机器人操作的标准基准套件上进行了比较:

| 任务 | 模块化控制(成功率) | 全身策略(成功率) | 提升幅度 |
|---|---|---|---|
| 插销入孔(紧公差) | 72% | 94% | +22% |
| 线缆穿过小孔 | 45% | 81% | +36% |
| 重箱搬运+精确放置 | 38% | 89% | +51% |
| 站立使用工具(电钻) | 61% | 92% | +31% |
| 平均任务完成时间 | 12.4秒 | 8.1秒 | -35% |

数据要点: 全身策略在性能上显著优于模块化控制,尤其是在需要同时进行粗大和精细运动协调的任务上。在搬运与放置任务上51%的提升凸显了动态腿部和腰部调整在使手臂和手能够在负载下执行精确对准方面的关键作用。

关键参与者与案例研究

多个组织正竞相将全身控制商业化,各自采取不同策略:

- Figure AI(加利福尼亚州桑尼韦尔):他们的Figure 02人形机器人使用在模拟中训练的学习型全身策略。他们已展示该机器人在携带30公斤箱子的同时行走,然后以毫米级精度将其放置在货架上。他们的方法强调通过域随机化实现从模拟到现实的迁移。
- Agility Robotics(俄勒冈州科瓦利斯):他们的Digit机器人最初专注于双足运动,最近增加了手臂操作功能。他们采用混合方法:基于模型的运动控制器加上学习型操作策略,但正朝着完全端到端训练的方向发展。
- Boston Dynamics(马萨诸塞州沃尔瑟姆):他们的Atlas机器人(现已改为电动版)展示了最具动态性的全身行为——跑酷、后空翻和重物操作。然而,他们的控制栈仍主要基于模型预测控制(MPC),而非完全学习型。
- 1X Technologies(挪威奥斯陆):他们的Neo人形机器人采用了类似于该突破的强化学习方法,专注于家务任务。他们已开源了部分训练流程。

| 公司 | 机器人 | 控制方法 | 关键差异化优势 | 技术就绪度(TRL) |
|---|---|---|---|---|
| Figure AI | Figure 02 | 端到端RL + 世界模型 | 最快的模拟到现实迁移 | 6-7(原型机现场试验中) |
| Agility Robotics | Digit | 混合(MPC用于运动,RL用于操作) | 经过验证的物流部署 | 7(商业化) |
| Boston Dynamics | Atlas(电动版) | MPC + 优化 | 最具动态性的行为 | 5-6(研究阶段) |
| 1X Technologies | Neo | 端到端RL | 开源训练工具 | 5(原型机) |

数据要点: Figure AI和1X正引领向完全学习型全身策略的转变,而Boston Dynamics和Agility则保留了经典控制的元素。

相关专题

reinforcement learning98 篇相关文章world model87 篇相关文章

时间归档

June 20261654 篇已发布文章

延伸阅读

100美元机器狗如何用轻量级世界模型掀翻英伟达GPU王座一只售价不到1000美元的机器狗,在真实世界运动测试中击败了英伟达旗舰仿真平台。AINews独家揭秘其核心秘密:一个运行在低功耗边缘芯片上的轻量级世界模型,完全绕过了GPU集群。这项突破可能终结“算力为王”的时代,并推动机器人技术走向大众化具身智能迎来“GPT-3时刻”:一小时训练达成99%成功率,缩放定律终获物理验证长期被假设的“具身缩放定律”获得决定性验证。一家领先的AI公司展示了一套系统,让机器人仅通过一小时的模拟训练,便能学会一项全新的复杂物理操作任务,并在现实世界中部署时达到99%的成功率。这标志着AI从纯软件智能向可扩展、快速适应的物理智能体具身智能迈入资本“季后赛”时代,280亿美元估值成新入场券具身智能赛道已跨越关键门槛。领军企业星海图完成的28亿美元里程碑式融资,不仅是一家公司的胜利,更标志着行业正从技术演示阶段,转向资本密集的“季后赛”时代。280亿美元估值,正成为参与严肃竞争的隐性入场券。深圳2026 AI创业大赛:应用为王,算法退居次席深圳正式启动2026年新一代人工智能创业大赛,标志着行业焦点从模型竞赛转向应用驱动生态。赛事优先考察世界模型、自主智能体与深度垂直整合,而非单纯的基准分数。

常见问题

这次模型发布“Whole-Body AI Control: How Robots Learn to Dance Through Precision Tasks”的核心内容是什么?

The robotics community has long fixated on improving grippers, tactile sensors, and finger-level control as the path to dexterous manipulation. But a growing body of research, culm…

从“whole-body control vs modular control comparison”看,这个模型发布为什么重要?

The core innovation is a unified neural network policy that maps high-dimensional sensory inputs—joint positions, torques, IMU data, and vision—directly to motor commands for all degrees of freedom (DoF) simultaneously.…

围绕“Figure AI whole-body control training method”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。