灵宇AI的云端大脑:百万小时真实机器人数据,重写具身智能游戏规则

May 2026
embodied intelligence归档:May 2026
灵宇AI(Lingyu AI)近日披露了一条颠覆性的具身智能路径:不卖硬件,只卖服务。其核心是一颗基于超过一百万小时真实机器人操作数据训练而成的“云端大脑”,并以此提供“机器人即服务”(RaaS)与“运营即服务”(OaaS)。这一模式将智能的核心从物理躯体转移至云端,有望让中小企业也能用上顶尖的机器人能力。

在一场与AINews的独家专访中,灵宇AI揭开了其通往具身智能的颠覆性路径:它不销售机器人。相反,它提供“机器人即服务”(RaaS)和“运营即服务”(OaaS)。该公司利用超过一百万小时的真实机器人操作数据,训练出了一个具备通用操作能力的“云端大脑”。这一模式从根本上挑战了传统的硬件优先思维,将智能的中心从物理躯体转移到了云端。通过绕过困扰仿真方法的臭名昭著的“仿真到现实”鸿沟,灵宇AI迫使它的AI直接从物理世界的混沌与不确定性中学习。其商业模式同样具有创新性:客户为操作能力付费,而非昂贵的硬件。

技术深度解析

灵宇AI的核心创新并非一款新的机械臂或新型传感器,而是一套训练方法论和云原生架构。该公司实际上是通过拒绝使用仿真,向“仿真到现实”鸿沟宣战。取而代之的是,它积累了超过一百万小时的真实世界机器人操作数据。这是一个惊人的数据量——相当于大约114年的连续运行。这些数据不仅仅是原始的传感器流;它们经过精心标注和结构化,用于训练一个基础操作模型。

架构:云端大脑 + 终端躯体

该系统分为两个截然不同的层级。“终端躯体”是一个标准的、成本相对较低的机械臂和夹爪——可以从任何主流制造商(例如Universal Robots、Fanuc或协作机器人厂商)采购的通用硬件。这些硬件被剥离了大部分机载智能;它本质上是一组执行器和传感器。“云端大脑”是一个托管在灵宇AI服务器上的大型神经网络。该网络接收来自终端躯体的实时传感数据(视觉、力、扭矩、本体感觉),进行处理,并发回电机指令。

这种架构让人联想到计算领域的“瘦客户端”模型。关键的技术挑战是延迟。对于精确操作,从传感器到云端再返回的往返时间必须低于10毫秒。灵宇AI声称通过边缘-云混合部署实现了这一点,其中本地边缘服务器运行模型的精简版本以处理低级控制回路,而完整的云端模型则负责高级规划和复杂任务。确切的网络架构是专有的,但它很可能类似于基于Transformer的策略网络,类似于Google的RT-2或开源的OpenVLA模型。开源社区在这方面一直很活跃:OpenVLA仓库(在GitHub上拥有超过4000颗星)提供了一个70亿参数的视觉-语言-动作模型,可以针对特定任务进行微调。灵宇AI的模型很可能是这一概念的一个规模化、专有化的版本,并在其独特的真实世界数据集上进行了训练。

数据策略:为何真实数据至关重要

百万小时的数据集是公司的护城河。仿真数据虽然生成成本低廉,但饱受“现实鸿沟”之苦——在仿真中训练的模型常常因未建模的物理特性、摩擦力、光照和材料属性而在现实世界中失败。通过仅使用真实数据,灵宇AI的模型学习了物理交互的真实分布。这些数据可能包含各种各样的任务:抓取与放置、组装、插入、销钉入孔、线缆布线等等。该公司尚未披露确切的数据构成,但“通用操作能力”的说法表明该数据集涵盖了数百种不同的任务类别。

性能基准

虽然灵宇AI尚未发布正式的基准测试,但我们可以将其方法与现有系统进行比较。下表根据操作任务的典型指标估算了性能:

| 指标 | 灵宇AI(估算) | 仿真训练模型(如RT-2) | 传统硬编码系统 |
|---|---|---|---|
| 任务成功率(新物体) | 75-85% | 40-60% | 90-95%(但仅限已知任务) |
| 对新任务的泛化能力 | 高(少样本) | 中 | 无 |
| 训练数据成本 | 非常高(真实数据) | 低(仿真数据) | 不适用(手工编码) |
| 延迟(云端) | 5-15毫秒 | 10-30毫秒 | <1毫秒(机载) |
| 硬件成本(每台) | 低(通用机械臂) | 中 | 高(定制) |

数据要点: 灵宇AI以训练成本和延迟为代价,换取了卓越的泛化能力。其在新物体上估算的75-85%的成功率,相比仿真训练模型有了巨大提升,但在特定重复性任务上仍不及硬编码系统。其价值主张很明确:灵活性优先于原始精度。

关键玩家与案例研究

灵宇AI正在进入一个拥挤但分散的市场。具身智能领域的关键玩家可以按其方法分类:

1. 硬件优先巨头:Boston DynamicsTesla (Optimus)Figure AI 这样的公司专注于构建先进的人形或仿生机器人。它们的价值在于硬件本身。它们销售或租赁机器人,智能是机载的。
2. 仿真优先初创公司: CovariantPhysical Intelligence (π) 使用重度仿真的训练流程。Covariant的“Covariant Brain”是一个基于云端的机器人抓取与放置AI,但它与其自有硬件紧密集成,并专注于物流领域。Physical Intelligence正在开发一个通用的“机器人基础模型”,但尚未将其商业化。
3. 数据优先(真实世界): 灵宇AI在完全依赖真实世界数据方面是独一无二的。最接近的竞争对手是Skild AI,它也在真实数据上训练,但专注于四足运动,而非操作。

商业模式对比

| 公司 | 核心产品 | 商业模式 |
|---|---|---|
| Boston Dynamics | 高级人形/仿生机器人硬件 | 销售/租赁硬件 |
| Covariant | 物流拣选AI + 自有硬件 | 销售集成系统 |
| Physical Intelligence | 机器人基础模型(未商业化) | 尚未确定 |
| Skild AI | 四足运动AI | 尚未确定 |
| 灵宇AI | 云端操作大脑 + RaaS/OaaS | 按操作能力付费 |

相关专题

embodied intelligence23 篇相关文章

时间归档

May 20261267 篇已发布文章

延伸阅读

Vbot's $70M Pre-A Shatters Records, Signaling Consumer Robotics' AI Brain RaceVbot (维他动力) has closed a 500 million RMB Pre-A funding round, the largest single investment ever recorded in the consume第一代机器人IPO:行业现实检验的开始一批第一代机器人公司正密集上市,迫使具身智能行业从炒作转向硬数据。AINews深入剖析技术、商业与战略因素,揭示哪些企业能在公开市场的严苛审视中存活。中国机器人军团突袭硅谷:三场战役定义物理AI未来中国机器人公司不再只是追赶者——它们正在重新定义物理AI的规则。通过激进的硬件成本削减与自研视频生成训练模型相结合,它们将人形机器人价格压至威胁硅谷巨头的水平。但三场关键战役——硬件可靠性、软件集成与全球服务基础设施——将决定谁能最终胜出。擎天柱300亿估值背后的20%机器人利用率:一场RaaS平台棋局估值高达300亿元的擎天柱,其机器人租赁平台的设备利用率却仅有20%。AINews调查发现,这个看似矛盾的数据点,实则揭示了从硬件销售向机器人即服务(RaaS)平台模式的深刻转型,正在重新定义具身智能的商业规则。

常见问题

这次公司发布“Lingyu AI’s Cloud Brain: A Million Hours of Real Robot Data Rewrites the Rules of Embodied Intelligence”主要讲了什么?

In an exclusive interview with AINews, Lingyu AI disclosed its disruptive path to embodied intelligence: it does not sell robots. Instead, it provides 'Robot-as-a-Service' (RaaS) a…

从“Lingyu AI cloud brain latency real-time control”看,这家公司的这次发布为什么值得关注?

Lingyu AI’s core innovation is not a new robot arm or a novel sensor, but a training methodology and a cloud-native architecture. The company has effectively declared war on the sim-to-real gap by simply refusing to use…

围绕“Lingyu AI vs Covariant vs Physical Intelligence comparison”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。