人形机器人迎来商业化黎明,但盈利之路依然漫长

2025年,一家标志性人形机器人公司报告订单量激增,这标志着该领域正从实验室原型迈向商业部署的关键过渡。这一突破不仅是机械工程的胜利,更是先进双足运动能力与复杂AI“大脑”的融合——具体而言,是多模态大语言模型与世界模型的结合,使机器人能够理解并适应非结构化环境。初步的商业应用似乎集中在高价值细分领域,如专业工业培训和柔性物流,这些场景中高昂的人力成本或传统自动化的局限性,为人形机器人的溢价提供了合理性。

尽管取得进展,但领先企业的财务报表依然显示深陷亏损。核心矛盾在于:一方面,硬件制造成本、研发投入和AI训练费用极其高昂;另一方面,当前的应用场景和出货量尚不足以摊薄这些成本,形成规模经济。行业正面临一个典型的技术成熟曲线挑战:技术突破带来了早期采用者,但要跨越鸿沟进入主流市场,必须在成本控制、可靠性和解决实际问题的能力上实现质的飞跃。目前,机器人“身体”的动态平衡与全身控制已通过模型预测控制等算法取得长足进步,而AI“心智”的进化——从执行脚本任务到理解情境——正成为新的分水岭。开源社区在仿真工具和训练框架上的贡献降低了研发门槛,但赋予机器人语义理解和任务规划能力的多模态AI,仍是头部公司建立壁垒的关键。未来几年,行业竞争将围绕“硬件成本优化”与“AI能力泛化”两条主线展开,谁能率先在这对矛盾中找到平衡点,谁才可能真正触及盈利的曙光。

技术深度解析

人形机器人近期的商业突破,源于“身体”与“心智”的双轨进化:物理本体的成熟与AI思维的革命性进步。

身体:从动态平衡到全身控制
早期的人形机器人(如本田ASIMO)依赖于在受控环境中执行精确的、预先计算好的轨迹。以波士顿动力Atlas为代表的现代一代,则采用了模型预测控制(MPC)全身脉冲控制(WBIC)。这些算法使机器人能够实时动态调整其质心和肢体轨迹,以应对意外干扰保持平衡。开源社区在此发挥了关键作用。源自MIT仿生实验室的 `MIT-Cheetah-Software` 代码库,提供了高性能运动控制器的基础代码,影响了商业设计。同样,为足式机器人强化学习训练而开发的 `raisim` 物理模拟器,已成为复杂动作快速原型设计和安全训练的标准工具。

心智:从脚本任务到情境理解
真正的差异化在于大模型基座的集成。机器人不再仅仅是执行预设步态移动到某个位置。它们现在使用如Google DeepMind的 RT-2(Robotics Transformer 2) 这样的视觉-语言-动作模型,将摄像头输入和自然语言指令直接转化为机器人动作。这得到了世界模型的增强——这是一种学习对环境进行压缩时空理解的神经网络,可实现预测和规划。例如,机器人现在可以看到一个托盘,理解“把它移到装卸码头”的指令,推断最佳抓取点和路径同时避开动态障碍物,并在发现地面湿滑时调整步态——所有这些都无需针对该特定场景进行显式编程。

| 技术组件 | 关键算法/模型 | 功能 | 代表性项目/代码库 |
|---|---|---|---|
| 运动 | 模型预测控制(MPC)、强化学习(RL) | 动态平衡、自适应行走 | `MIT-Cheetah-Software`, `legged_gym`(NVIDIA Isaac Gym) |
| 操控 | 模仿学习、密集接触RL | 灵巧手部与手臂控制 | `robomimic`(Facebook AI), `DexGraspNet` |
| 感知与规划 | 视觉-语言-动作(VLA)模型、世界模型 | 场景理解、任务推理、长程规划 | RT-2, `OpenVLA`(开源VLA), `CortexBench` |
| 仿真 | GPU加速物理引擎(RaiSim, MuJoCo) | 安全、可扩展的训练环境 | `raisim`, `Isaac Sim`(NVIDIA) |

核心洞见: 现代人形机器人的架构是专用硬件控制器与通用AI模型的紧密集成栈。进步日益由开源仿真工具和训练框架驱动,它们降低了开发鲁棒控制策略的门槛,而多模态AI的专有进展则提供了关键的语义理解层。

关键参与者与案例研究

行业格局由两类玩家构成:拥有雄厚研发资金的传统巨头,以及押注AI优先方法的敏捷初创公司。

传统强者:波士顿动力
波士顿动力的Atlas机器人仍然是动态运动能力的黄金标准,其跑酷和复杂装配任务演示便是明证。然而,其商业化路径是通过其四足机器人Spot实现的,后者已在工业检测和公共安全领域找到角色。公司对Atlas的战略似乎是瞄准超高价值的利基工业应用,其无与伦比的移动性足以支撑七位数的价格标签。CEO Robert Playter强调,重点正从运动的“如何实现”转向有用任务的“执行内容”,这一转变通过集成更先进的AI任务规划器得以实现。

AI原生挑战者:Figure AI
Figure AI代表了新浪潮。与OpenAI合作,Figure专注于将强大的视觉-语言模型直接集成到其Figure 01机器人中。结果是实现了惊人自然的人机交互;机器人能够理解“我饿了”这样模糊的指令,并执行一系列动作(定位食品包装、取回、递送)。其商业模式瞄准物流和制造业的通用劳动力,旨在通过面向制造的设计和利用云端AI来实现更低的价格点。创始人Brett Adcock认为,AI而非机械结构,现在是主要的瓶颈和差异化因素。

电动汽车巨头的赌注:特斯拉Optimus
特斯拉的方法根本不同:将规模化制造置于首位。埃隆·马斯克将Optimus定位为一款将利用特斯拉在电池、执行器以及关键是其Dojo超级计算机(用于训练)方面专业知识的产物。其设计优先考虑成本效益和制造可行性,采用相对简约的机械设计,并大量依赖其在汽车制造中积累的规模化能力和供应链管理经验。特斯拉的潜在优势在于,如果能将人形机器人的成本降至汽车级别,将可能开启一个巨大的消费级或准消费级市场。然而,其AI能力,特别是在复杂、非结构化环境中的泛化能力,仍需经受考验。Optimus的成败,或将验证“制造规模先行,AI能力迭代跟进”这一路径的可行性。

常见问题

这次公司发布“Humanoid Robotics Reaches Commercial Dawn, But Profitability Remains Elusive”主要讲了什么?

A landmark humanoid robotics firm has reported a dramatic surge in orders in 2025, signaling a critical transition from laboratory prototypes to commercial deployment. This breakth…

从“Boston Dynamics Atlas commercial price 2025”看,这家公司的这次发布为什么值得关注?

The recent commercial inroads by humanoid robots are the result of a dual-track evolution: the maturation of the physical 'body' and the revolutionary advancement of the AI 'mind'. The Body: From Dynamic Balance to Whole…

围绕“Figure AI robot cost per unit manufacturing”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。