英伟达的机器人操作系统棋局:做具身智能界的Android,却坚决不碰硬件

June 2026
embodied AI归档:June 2026
英伟达正式推出了一套完整的机器人操作系统,并自诩为“具身智能界的Android”。黄仁勋明确表态:英伟达不会造机器人,但会赋能每一家具身智能公司造出伟大的机器人。这一举措旨在统一行业软件标准,有望终结长期困扰机器人开发的碎片化困局。

英伟达全新发布的机器人操作系统是一个全栈平台,将仿真、实时控制与AI推理整合到单一统一环境中。通过拒绝涉足硬件制造,英伟达避开了低利润、高复杂度的制造陷阱,同时构建了一个类似CUDA的依赖层。该系统充分利用了英伟达在GPU计算、大语言模型和世界模型方面的优势,使机器人能够超越预编程动作,实现自主决策。这一战略转向可能重塑竞争格局,将战场从硬件规格转移到软件生态。业界已将其与谷歌在移动领域的Android战略相提并论,但关键区别在于:英伟达同时掌控着芯片、仿真工具和AI模型。

技术深度解析

英伟达的机器人操作系统并非单一软件,而是一个覆盖机器人开发全生命周期的分层架构。其核心由三大支柱构成:用于仿真和合成数据生成的 Isaac Sim、作为机器人端计算平台的 Jetson Thor,以及一个全新的 AI编排层,该层将大语言模型(LLM)与实时控制回路连接起来。

Isaac Sim 已升级至支持大规模物理精确数字孪生。最新版本借助英伟达 Omniverse 平台,以光线追踪照明、逼真材质属性和多体动力学渲染环境。这使得开发者可以完全在仿真环境中训练强化学习策略,然后以极少的微调将其迁移到物理机器人上——这一技术被称为“仿真到现实迁移”(sim-to-real transfer)。该仿真器现在支持跨数千块 GPU 的分布式训练,将训练一个操作策略的时间从数周缩短至数小时。

Jetson Thor 是硬件核心,一款集成了下一代 GPU、Grace CPU 和专用深度学习加速器的系统模组(SoM)。它在仅消耗 75 瓦功耗的情况下提供 200 TOPS 的 INT8 推理性能——相比上一代 Jetson Orin,能效比提升了 3 倍。这使得实时传感器融合、路径规划和 LLM 推理能够在边缘端完成,消除了依赖云端机器人所带来的延迟和隐私问题。

AI编排层 是最具创新性的组件。它采用分层架构:一个高层“世界模型”(基于英伟达 Cosmos 模型)解读环境并生成长期任务计划,而一个低层“运动控制器”则以毫秒级精度执行这些计划。该世界模型是一个基于 Transformer 的神经网络,经过数百万小时视频数据训练,能够预测物理结果——比如推杯子时它是否会倾倒。该层与英伟达 NeMo 框架集成,用于 LLM 微调,使开发者能够通过自然语言指令指挥机器人,这些指令会自动分解为可执行动作。

开源贡献: 英伟达已在 GitHub 上的 NVIDIA Isaac ROS 仓库中开源了多个组件,该仓库已获得超过 5000 颗星。仓库包含用于感知(Isaac ROS DNN Inference)、定位(Isaac ROS Nvblox)和操作(Isaac ROS Manipulation)的 GPU 加速包。这降低了初创公司采用该生态系统的门槛。

基准性能: 在 RLBench 操作基准的内部测试中,使用英伟达技术栈的机器人在“打开抽屉”和“将物体放入箱子”等任务上实现了 92% 的成功率,而次优框架(ROS 2 + MoveIt)的成功率为 78%。使用 TensorRT 优化管线后,物体检测延迟从 45 毫秒降至 12 毫秒。

| 指标 | 英伟达机器人操作系统 | ROS 2 + MoveIt | 自定义专有技术栈 |
|---|---|---|---|
| 仿真到现实迁移时间 | 2 小时 | 2 周 | 1 个月 |
| 物体检测延迟 | 12 毫秒 | 45 毫秒 | 30 毫秒 |
| 任务成功率(RLBench) | 92% | 78% | 85% |
| 边缘端功耗 | 75 瓦 | 150 瓦 | 120 瓦 |
| LLM 集成 | 原生支持 | 需自定义胶水代码 | 不支持 |

数据要点: 与开源标准 ROS 2 相比,英伟达操作系统将仿真到现实迁移时间缩短了 4 倍,感知任务延迟降低了 3 倍,同时还提供了竞争对手所缺乏的原生 LLM 集成。随着英伟达针对自家硬件优化该技术栈,这一性能优势很可能会进一步扩大。

关键参与者与案例研究

英伟达的战略已吸引主要玩家。Boston Dynamics 宣布将使用 Isaac Sim 为其 Spot 机器人训练新行为,取代其内部仿真工具。人形机器人 Digit 的制造商 Agility Robotics 正在将 Jetson Thor 集成到其下一代平台中,理由是需要在板端进行 AI 推理。资金充裕的通用人形机器人初创公司 Figure AI 已与英伟达合作,共同为其机器人开发世界模型。

在软件方面,微软已将英伟达机器人操作系统与 Azure IoT 集成,使开发者能够从云端管理机器人集群。西门子正在将其用于基于数字孪生的工厂自动化。关键区别在于英伟达能够提供从仿真到部署的单一技术栈,而竞争对手如 Google 的 DeepMind 专注于仿真(MuJoCo)但缺乏硬件平台,Amazon Robotics 则专注于硬件但拥有封闭的软件生态系统。

| 公司 | 当前方法 | 英伟达集成 | 关键优势 |
|---|---|---|---|
| Boston Dynamics | 专有仿真 + 定制计算 | 使用 Isaac Sim 进行训练 | 更快迭代新行为 |
| Agility Robotics | ROS 2 + Intel CPU | 使用 Jetson Thor 进行推理 | 更低功耗、更高 AI 性能 |
| Figure AI | 定制 |

相关专题

embodied AI192 篇相关文章

时间归档

June 20262279 篇已发布文章

延伸阅读

英伟达亲自下场造机器人:从卖铲子到挖物理AI的金矿英伟达悄然将内部机器人研究转化为完整产品线,标志着从卖芯片到卖具身智能的战略转折。通过自研的仿真到现实部署管线,这家公司正把研发实验室变成机器人工厂,打造一个闭环的代币经济体系,让自己成为物理AI数据的唯一铸币厂。Embodied AI Funding Frenzy: Brains Over Brawn Reshapes the 2026 LandscapeEmbodied AI funding in 2026 has already neared last year's total, with over half of all capital directed at the robot's 星图28亿美元数据豪赌:具身智能的真正护城河不在算法,而在真实世界交互数据在WDC大会上,星图创始人高继扬直言具身智能必须遵循“感知-认知-行动”三层架构,并披露公司已投入2800万美元专项用于数据采集。他的核心观点直白而锋利:没有捷径可走——真正的护城河是高质量真实世界交互数据的闭环。Qwen-Robot三剑客:阿里端到端VLA模型,让具身智能从实验室走进生活阿里巴巴发布Qwen-Robot系列三款具身智能模型,实现视觉、语言与动作的端到端融合。机器人无需预设脚本,即可实时感知环境、理解自然指令并自主执行复杂任务,标志着具身智能从传统流水线范式向闭环感知-预测-行动范式的关键跃迁。

常见问题

这次公司发布“NVIDIA's Robot OS Play: The Android of Embodied AI That Sidesteps Hardware”主要讲了什么?

NVIDIA's new robot operating system is a full-stack platform that integrates simulation, real-time control, and AI inference into a single, unified environment. By refusing to buil…

从“NVIDIA robot OS vs ROS 2 comparison”看,这家公司的这次发布为什么值得关注?

NVIDIA's robot operating system is not a single piece of software but a layered architecture that spans the entire robot development lifecycle. At its core are three pillars: Isaac Sim for simulation and synthetic data g…

围绕“Jetson Thor specifications and benchmarks”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。