人形机器人迎来商业化黎明，但盈利之路依然漫长

2025年，一家标志性人形机器人公司报告订单量激增，这标志着该领域正从实验室原型迈向商业部署的关键过渡。这一突破不仅是机械工程的胜利，更是先进双足运动能力与复杂AI“大脑”的融合——具体而言，是多模态大语言模型与世界模型的结合，使机器人能够理解并适应非结构化环境。初步的商业应用似乎集中在高价值细分领域，如专业工业培训和柔性物流，这些场景中高昂的人力成本或传统自动化的局限性，为人形机器人的溢价提供了合理性。

尽管取得进展，但领先企业的财务报表依然显示深陷亏损。核心矛盾在于：一方面，硬件制造成本、研发投入和AI训练费用极其高昂；另一方面，当前的应用场景和出货量尚不足以摊薄这些成本，形成规模经济。行业正面临一个典型的技术成熟曲线挑战：技术突破带来了早期采用者，但要跨越鸿沟进入主流市场，必须在成本控制、可靠性和解决实际问题的能力上实现质的飞跃。目前，机器人“身体”的动态平衡与全身控制已通过模型预测控制等算法取得长足进步，而AI“心智”的进化——从执行脚本任务到理解情境——正成为新的分水岭。开源社区在仿真工具和训练框架上的贡献降低了研发门槛，但赋予机器人语义理解和任务规划能力的多模态AI，仍是头部公司建立壁垒的关键。未来几年，行业竞争将围绕“硬件成本优化”与“AI能力泛化”两条主线展开，谁能率先在这对矛盾中找到平衡点，谁才可能真正触及盈利的曙光。

技术深度解析

人形机器人近期的商业突破，源于“身体”与“心智”的双轨进化：物理本体的成熟与AI思维的革命性进步。

身体：从动态平衡到全身控制
早期的人形机器人（如本田ASIMO）依赖于在受控环境中执行精确的、预先计算好的轨迹。以波士顿动力Atlas为代表的现代一代，则采用了模型预测控制（MPC）和全身脉冲控制（WBIC）。这些算法使机器人能够实时动态调整其质心和肢体轨迹，以应对意外干扰保持平衡。开源社区在此发挥了关键作用。源自MIT仿生实验室的 `MIT-Cheetah-Software` 代码库，提供了高性能运动控制器的基础代码，影响了商业设计。同样，为足式机器人强化学习训练而开发的 `raisim` 物理模拟器，已成为复杂动作快速原型设计和安全训练的标准工具。

心智：从脚本任务到情境理解
真正的差异化在于大模型基座的集成。机器人不再仅仅是执行预设步态移动到某个位置。它们现在使用如Google DeepMind的 RT-2（Robotics Transformer 2） 这样的视觉-语言-动作模型，将摄像头输入和自然语言指令直接转化为机器人动作。这得到了世界模型的增强——这是一种学习对环境进行压缩时空理解的神经网络，可实现预测和规划。例如，机器人现在可以看到一个托盘，理解“把它移到装卸码头”的指令，推断最佳抓取点和路径同时避开动态障碍物，并在发现地面湿滑时调整步态——所有这些都无需针对该特定场景进行显式编程。

| 技术组件 | 关键算法/模型 | 功能 | 代表性项目/代码库 |
|---|---|---|---|
| 运动 | 模型预测控制（MPC）、强化学习（RL） | 动态平衡、自适应行走 | `MIT-Cheetah-Software`, `legged_gym`（NVIDIA Isaac Gym） |
| 操控 | 模仿学习、密集接触RL | 灵巧手部与手臂控制 | `robomimic`（Facebook AI）, `DexGraspNet` |
| 感知与规划 | 视觉-语言-动作（VLA）模型、世界模型 | 场景理解、任务推理、长程规划 | RT-2, `OpenVLA`（开源VLA）, `CortexBench` |
| 仿真 | GPU加速物理引擎（RaiSim, MuJoCo） | 安全、可扩展的训练环境 | `raisim`, `Isaac Sim`（NVIDIA） |

核心洞见： 现代人形机器人的架构是专用硬件控制器与通用AI模型的紧密集成栈。进步日益由开源仿真工具和训练框架驱动，它们降低了开发鲁棒控制策略的门槛，而多模态AI的专有进展则提供了关键的语义理解层。

关键参与者与案例研究

行业格局由两类玩家构成：拥有雄厚研发资金的传统巨头，以及押注AI优先方法的敏捷初创公司。

传统强者：波士顿动力
波士顿动力的Atlas机器人仍然是动态运动能力的黄金标准，其跑酷和复杂装配任务演示便是明证。然而，其商业化路径是通过其四足机器人Spot实现的，后者已在工业检测和公共安全领域找到角色。公司对Atlas的战略似乎是瞄准超高价值的利基工业应用，其无与伦比的移动性足以支撑七位数的价格标签。CEO Robert Playter强调，重点正从运动的“如何实现”转向有用任务的“执行内容”，这一转变通过集成更先进的AI任务规划器得以实现。

AI原生挑战者：Figure AI
Figure AI代表了新浪潮。与OpenAI合作，Figure专注于将强大的视觉-语言模型直接集成到其Figure 01机器人中。结果是实现了惊人自然的人机交互；机器人能够理解“我饿了”这样模糊的指令，并执行一系列动作（定位食品包装、取回、递送）。其商业模式瞄准物流和制造业的通用劳动力，旨在通过面向制造的设计和利用云端AI来实现更低的价格点。创始人Brett Adcock认为，AI而非机械结构，现在是主要的瓶颈和差异化因素。

电动汽车巨头的赌注：特斯拉Optimus
特斯拉的方法根本不同：将规模化制造置于首位。埃隆·马斯克将Optimus定位为一款将利用特斯拉在电池、执行器以及关键是其Dojo超级计算机（用于训练）方面专业知识的产物。其设计优先考虑成本效益和制造可行性，采用相对简约的机械设计，并大量依赖其在汽车制造中积累的规模化能力和供应链管理经验。特斯拉的潜在优势在于，如果能将人形机器人的成本降至汽车级别，将可能开启一个巨大的消费级或准消费级市场。然而，其AI能力，特别是在复杂、非结构化环境中的泛化能力，仍需经受考验。Optimus的成败，或将验证“制造规模先行，AI能力迭代跟进”这一路径的可行性。

常见问题

这次公司发布“Humanoid Robotics Reaches Commercial Dawn, But Profitability Remains Elusive”主要讲了什么？

A landmark humanoid robotics firm has reported a dramatic surge in orders in 2025, signaling a critical transition from laboratory prototypes to commercial deployment. This breakth…

从“Boston Dynamics Atlas commercial price 2025”看，这家公司的这次发布为什么值得关注？

The recent commercial inroads by humanoid robots are the result of a dual-track evolution: the maturation of the physical 'body' and the revolutionary advancement of the AI 'mind'. The Body: From Dynamic Balance to Whole…

围绕“Figure AI robot cost per unit manufacturing”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。