舞台之外:中国具身智能企业进军硅谷的四条路径

May 2026
embodied AI归档:May 2026
中国人形机器人制造商正以一套“现实主义”打法,走出实验室的展示舞台。AINews 梳理出四种清晰的全球化扩张策略——从直接销售到开放平台——它们正在重塑具身智能领域的竞争格局。

具身智能的全球竞赛已不再是跳舞机器人和学术论文的秀场。中国公司经过多年打磨,在成本效益硬件和强大 AI 堆栈上积累了深厚功底,如今正以四种明确的战略模式系统性地进入国际市场——尤其是硅谷。第一种模式是面向工业客户的直接产品销售,凭借激进定价和经过验证的部署效率取胜。第二种是技术授权,中国公司将自身的 AI“大脑”和运动控制算法出售给缺乏内部智能能力的海外机器人制造商。第三种是与全球顶级实验室开展联合研究,保持在操作、运动与世界模型领域的前沿地位。第四种也是最具雄心的模式,是开放平台。这四种路径的背后,是大语言模型(LLM)与世界模型融合为统一机器人堆栈的核心技术突破。中国公司如 Agibot 在参数更少、延迟更低的情况下,已缩小了与 Google RT-2 的性能差距,这种成本优势直接驱动了它们的全球扩张。

技术深度解析

支撑这四条扩张路径的核心驱动力,是大语言模型(LLM)与世界模型融合为统一的机器人堆栈。历史上,机器人控制是脆弱的:每个任务都需要手写奖励函数或特定任务的模仿学习。如今,这个堆栈分为三层:

1. 用于规划的基座模型(Foundation Model for Planning):LLM(如 GPT-4o、Claude 3.5,或 Qwen2.5 等开源替代品)充当高层推理层。它们将自然语言指令解析为符号化的任务计划。例如,“拿起红色杯子并放在桌子上”被分解为子目标:定位杯子、规划抓取、移动手臂、释放。

2. 视觉-语言-动作模型(VLA Model):这是关键的桥梁。像 Google DeepMind 的 RT-2,或开源模型 OpenVLA(一个从预训练视觉语言模型微调而来的 7B 参数模型),直接将像素和语言映射为电机指令。中国公司如 Agibot 和 Unitree 已开发出自己的 VLA 变体,在数百万条真实世界和模拟轨迹上进行了训练。

3. 底层运动控制器(Low-Level Motion Controller):负责实时稳定性和扭矩控制。经典的模型预测控制(MPC)现在通过神经网络的残差学习得到增强。例如,开源仓库 `mujoco_menagerie`(GitHub 上超过 3000 星)为许多人形机器人提供了标准化的 MuJoCo 模型,支持仿真到现实的迁移。另一个关键仓库是 `legged_gym`(超过 2500 星),它提供了一个在仿真中训练运动策略并将其部署到真实机器人的框架。

关键的技术突破是跨形态泛化(Cross-Embodiment Generalization)。在一个机器人手臂上训练出的 VLA 模型,只需极少的微调,就能控制另一个具有不同运动学结构的手臂。这是通过动作标记化和相对位置编码实现的。这种泛化能力使得开放平台模式成为可能:一家中国公司可以提供一种“通用大脑”,适用于不同的硬件合作伙伴。

性能基准测试

| 模型 | 参数规模 | 成功率(桌面操作) | 延迟(毫秒) | 训练数据(回合数) |
|---|---|---|---|---|
| RT-2 (Google) | 55B | 72% | 300 | 130,000 |
| OpenVLA (开源) | 7B | 68% | 150 | 60,000 |
| Agibot VLA (专有) | ~13B | 81% | 120 | 200,000 |
| Unitree H1 VLA | ~8B | 75% | 180 | 100,000 |

数据要点:像 Agibot 这样的中国公司,通过更高效的训练数据整理和硬件感知的模型设计,在参数显著更少、延迟更低的情况下,已经缩小了与 Google RT-2 的性能差距。这种成本优势直接驱动了它们的全球扩张。

关键玩家与案例研究

四家公司分别代表了四条路径:

1. 直接销售:Unitree Robotics
Unitree 积极向全球工业客户推销其 H1 和 G1 人形机器人。其策略是纯粹的价格竞争:G1 定价为 16,000 美元,大约是 Boston Dynamics 的 Atlas 成本的十分之一。他们已在汽车工厂(例如与一家欧洲主要汽车制造商合作)获得了试点部署,用于重复性任务,如料箱拣选和零件检测。其 GitHub 仓库 `unitree_ros`(超过 1800 星)提供了 ROS 驱动和仿真模型,降低了海外集成商的门槛。

2. 技术授权:Agibot
由前华为工程师创立的 Agibot 选择了以授权为先的方法。他们提供名为“Cortex”的 AI 大脑作为软件开发工具包(SDK),外国机器人制造商可以将其集成到自己的硬件中。一个值得注意的交易是与一家日本工业机器人制造商达成的,该制造商使用 Agibot 的 VLA 模型升级其旧款机械臂,使其具备基于视觉的抓取和放置能力。这避免了硬件重新设计的需要。

3. 联合研发:Zhiyuan Robotics
Zhiyuan 与 MIT 的 CSAIL 建立了联合实验室,专注于灵巧操作。这项合作于 2025 年初宣布,涉及共享仿真环境和真实世界数据。Zhiyuan 提供硬件(其“X1”人形平台),而 MIT 贡献用于手内重新定向的新算法。这条路径更少关注即时收入,更多关注获取顶级研究人才和信誉。

4. 开放平台:Xiaomi 的 CyberOne 生态系统
Xiaomi 采取了最大胆的举措:开源其 CyberOne 机器人的硬件设计,并推出了“CyberBrain”平台。国际硬件初创公司可以围绕 Xiaomi 标准化的 AI 堆栈构建定制机器人,该堆栈包括语音识别、导航和操作 API。该平台已在北美和欧洲拥有 15 个注册合作伙伴,正在构建用于老年护理和仓库物流的机器人。

竞争对比

| 公司 | 策略 | 关键产品 | 价格点 | 全球合作伙伴 | GitHub 仓库(星数) |
|---|---|---|---|---|---|
| Unitree | 直接销售 | G1 人形机器人 | $16,000 | 待补充 | unitree_ros (1800+) |
| Agibot | 技术授权 | Cortex AI SDK | 未公开 | 日本工业机器人制造商 | 待补充 |
| Zhiyuan | 联合研发 | X1 人形平台 | 未公开 | MIT CSAIL | 待补充 |
| Xiaomi | 开放平台 | CyberBrain | 未公开 | 15 家北美/欧洲合作伙伴 | 待补充 |

相关专题

embodied AI144 篇相关文章

时间归档

May 20262491 篇已发布文章

延伸阅读

680亿采购清单下达:具身智能必须证明其投资回报率,否则出局一份价值680亿元人民币的采购清单正式落地,要求具身智能行业必须回答一个终极问题:它到底能不能赚钱?这标志着该行业从炫技式演示向工业交付的转型,每一个关节电机、每一行代码都必须证明其成本合理性。中国机器人劳动力:从炫技表演到工厂大脑的务实转身中国机器人产业正经历一场静默革命:重心从炫目的人形机器人演示,转向以数据驱动的实用型“工人”机器人,它们正走进工厂和厨房。AINews 深入调查这场由真实劳动数据驱动的“大脑训练”如何催生新一代适应性强、成本效益高的自动化方案。人形机器人决战之年:智元向宇树发起全面挑战,但胜负手已转向具身智能人形机器人赛道正式进入行业所谓的“终局之战”。新锐玩家智元正对老牌霸主宇树发起全面冲击,但竞争的核心已从硬件性能转向具身智能的深度整合。AINews深度解析:谁能将大语言模型、世界模型与物理控制无缝融合,谁就将赢得2026年的最终胜利。万台人形机器人订单落地:硬件竞赛已提前终结?智元机器人通过合作伙伴领益智造下达了超过1万台人形机器人的空前订单,推动行业从实验室原型迈向工厂流水线。但当硬件开始规模化,真正的考验转向了让这些机器具备实用价值的具身智能。

常见问题

这次公司发布“Beyond the Stage: Four Routes Chinese Embodied AI Firms Take to Silicon Valley”主要讲了什么?

The global race for embodied AI is no longer a spectacle of dancing robots and academic papers. Chinese companies, having spent years perfecting cost-effective hardware and robust…

从“Unitree G1 humanoid robot price specifications”看,这家公司的这次发布为什么值得关注?

The core enabler behind these four expansion paths is the convergence of large language models (LLMs) and world models into a unified robotics stack. Historically, robot control was brittle: each task required hand-coded…

围绕“Agibot Cortex SDK licensing cost”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。