灵宇AI的云端大脑：百万小时真实机器人数据，重写具身智能游戏规则

Q: 围绕“Lingyu AI vs Covariant vs Physical Intelligence comparison”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。

在一场与AINews的独家专访中，灵宇AI揭开了其通往具身智能的颠覆性路径：它不销售机器人。相反，它提供“机器人即服务”（RaaS）和“运营即服务”（OaaS）。该公司利用超过一百万小时的真实机器人操作数据，训练出了一个具备通用操作能力的“云端大脑”。这一模式从根本上挑战了传统的硬件优先思维，将智能的中心从物理躯体转移到了云端。通过绕过困扰仿真方法的臭名昭著的“仿真到现实”鸿沟，灵宇AI迫使它的AI直接从物理世界的混沌与不确定性中学习。其商业模式同样具有创新性：客户为操作能力付费，而非昂贵的硬件。

技术深度解析

灵宇AI的核心创新并非一款新的机械臂或新型传感器，而是一套训练方法论和云原生架构。该公司实际上是通过拒绝使用仿真，向“仿真到现实”鸿沟宣战。取而代之的是，它积累了超过一百万小时的真实世界机器人操作数据。这是一个惊人的数据量——相当于大约114年的连续运行。这些数据不仅仅是原始的传感器流；它们经过精心标注和结构化，用于训练一个基础操作模型。

架构：云端大脑 + 终端躯体

该系统分为两个截然不同的层级。“终端躯体”是一个标准的、成本相对较低的机械臂和夹爪——可以从任何主流制造商（例如Universal Robots、Fanuc或协作机器人厂商）采购的通用硬件。这些硬件被剥离了大部分机载智能；它本质上是一组执行器和传感器。“云端大脑”是一个托管在灵宇AI服务器上的大型神经网络。该网络接收来自终端躯体的实时传感数据（视觉、力、扭矩、本体感觉），进行处理，并发回电机指令。

这种架构让人联想到计算领域的“瘦客户端”模型。关键的技术挑战是延迟。对于精确操作，从传感器到云端再返回的往返时间必须低于10毫秒。灵宇AI声称通过边缘-云混合部署实现了这一点，其中本地边缘服务器运行模型的精简版本以处理低级控制回路，而完整的云端模型则负责高级规划和复杂任务。确切的网络架构是专有的，但它很可能类似于基于Transformer的策略网络，类似于Google的RT-2或开源的OpenVLA模型。开源社区在这方面一直很活跃：OpenVLA仓库（在GitHub上拥有超过4000颗星）提供了一个70亿参数的视觉-语言-动作模型，可以针对特定任务进行微调。灵宇AI的模型很可能是这一概念的一个规模化、专有化的版本，并在其独特的真实世界数据集上进行了训练。

数据策略：为何真实数据至关重要

百万小时的数据集是公司的护城河。仿真数据虽然生成成本低廉，但饱受“现实鸿沟”之苦——在仿真中训练的模型常常因未建模的物理特性、摩擦力、光照和材料属性而在现实世界中失败。通过仅使用真实数据，灵宇AI的模型学习了物理交互的真实分布。这些数据可能包含各种各样的任务：抓取与放置、组装、插入、销钉入孔、线缆布线等等。该公司尚未披露确切的数据构成，但“通用操作能力”的说法表明该数据集涵盖了数百种不同的任务类别。

性能基准

虽然灵宇AI尚未发布正式的基准测试，但我们可以将其方法与现有系统进行比较。下表根据操作任务的典型指标估算了性能：

| 指标 | 灵宇AI（估算） | 仿真训练模型（如RT-2） | 传统硬编码系统 |
|---|---|---|---|
| 任务成功率（新物体） | 75-85% | 40-60% | 90-95%（但仅限已知任务） |
| 对新任务的泛化能力 | 高（少样本） | 中 | 无 |
| 训练数据成本 | 非常高（真实数据） | 低（仿真数据） | 不适用（手工编码） |
| 延迟（云端） | 5-15毫秒 | 10-30毫秒 | <1毫秒（机载） |
| 硬件成本（每台） | 低（通用机械臂） | 中 | 高（定制） |

数据要点： 灵宇AI以训练成本和延迟为代价，换取了卓越的泛化能力。其在新物体上估算的75-85%的成功率，相比仿真训练模型有了巨大提升，但在特定重复性任务上仍不及硬编码系统。其价值主张很明确：灵活性优先于原始精度。

关键玩家与案例研究

灵宇AI正在进入一个拥挤但分散的市场。具身智能领域的关键玩家可以按其方法分类：

1. 硬件优先巨头： 像Boston Dynamics、Tesla (Optimus) 和 Figure AI 这样的公司专注于构建先进的人形或仿生机器人。它们的价值在于硬件本身。它们销售或租赁机器人，智能是机载的。
2. 仿真优先初创公司： Covariant 和 Physical Intelligence (π) 使用重度仿真的训练流程。Covariant的“Covariant Brain”是一个基于云端的机器人抓取与放置AI，但它与其自有硬件紧密集成，并专注于物流领域。Physical Intelligence正在开发一个通用的“机器人基础模型”，但尚未将其商业化。
3. 数据优先（真实世界）： 灵宇AI在完全依赖真实世界数据方面是独一无二的。最接近的竞争对手是Skild AI，它也在真实数据上训练，但专注于四足运动，而非操作。

商业模式对比

| 公司 | 核心产品 | 商业模式 |
|---|---|---|
| Boston Dynamics | 高级人形/仿生机器人硬件 | 销售/租赁硬件 |
| Covariant | 物流拣选AI + 自有硬件 | 销售集成系统 |
| Physical Intelligence | 机器人基础模型（未商业化） | 尚未确定 |
| Skild AI | 四足运动AI | 尚未确定 |
| 灵宇AI | 云端操作大脑 + RaaS/OaaS | 按操作能力付费 |

时间归档

延伸阅读

常见问题

这次公司发布“Lingyu AI’s Cloud Brain: A Million Hours of Real Robot Data Rewrites the Rules of Embodied Intelligence”主要讲了什么？

In an exclusive interview with AINews, Lingyu AI disclosed its disruptive path to embodied intelligence: it does not sell robots. Instead, it provides 'Robot-as-a-Service' (RaaS) a…

从“Lingyu AI cloud brain latency real-time control”看，这家公司的这次发布为什么值得关注？

Lingyu AI’s core innovation is not a new robot arm or a novel sensor, but a training methodology and a cloud-native architecture. The company has effectively declared war on the sim-to-real gap by simply refusing to use…

围绕“Lingyu AI vs Covariant vs Physical Intelligence comparison”，这次发布可能带来哪些后续影响？