技术深度解析
对踏石智能的4.55亿美元押注,本质上是对一套旨在解决“现实鸿沟”——即仿真训练与可靠现实表现之间巨大差距——的特定技术栈的豪赌。其核心创新在于将大规模世界模型与分层智能体架构相融合。
传统机器人技术依赖于在狭窄领域内精心编程的行为或强化学习。从踏石智能的研究论文和招聘信息推断,其方法似乎是一个多层系统:顶层是一个多模态规划LLM(例如基于GPT-4V或Claude 3等模型微调的变体),它处理自然语言指令和视觉场景数据,生成高级任务计划(如“卸下托盘,然后按尺寸分拣箱子”)。该计划由一个符号推理器分解,将抽象概念转化为存储在技能库中的、可执行的基础技能序列。
关键的中层是神经世界模型。这是一个可微分、通过学习得到的物理及物体交互模拟器。与NVIDIA的Isaac Sim或PyBullet等刚性物理引擎不同,神经世界模型(受DeepMind的DreamerV3或开源项目OpenWorldModel等工作的启发)通过海量真实与仿真交互数据进行训练。它能预测行动结果,使系统能够进行“基于想象的”规划——在执行任何现实动作前,运行数千次内部模拟以评估行动序列。这使其能够处理新物体并从失败中恢复。
最后,底层策略网络将世界模型规划的行动转化为精确的运动控制。该网络通过强化学习训练,但关键在于,其训练过程因世界模型的预测而得到极大加速和规范化,这是一种被称为基于模型的强化学习的技术。
| 技术组件 | 核心功能 | 关键挑战 | 代表性开源项目 |
|---|---|---|---|
| 多模态LLM规划器 | 高层任务理解与分解 | 空间推理、长程规划 | RT-2(谷歌)– 视觉-语言-动作模型 |
| 神经世界模型 | 预测行动的物理结果 | 仿真到现实的迁移、计算成本 | DreamerV3 – 通过世界模型实现可扩展RL |
| 分层智能体框架 | 协调规划与执行 | 技能库管理、误差传播 | Open X-Embodiment – 大规模机器人数据集与策略 |
| 底层策略网络 | 执行精确运动控制 | 动态适应、安全保证 | robomimic(Facebook)– 机器人模仿学习 |
核心洞见: 该架构是一种混合体,结合了LLM的推理能力、学习型世界模型的预测准确性以及传统控制策略的鲁棒性。成功的关键在于这些不同组件的无缝集成,这正是踏石智能团队必须克服的主要工程障碍。
关键参与者与案例研究
具身AI领域已不再是一个小众的学术领域,而是一个竞争激烈、战略路径各异的竞技场。
平台野心:踏石智能 将自己定位为全栈平台提供商。其目标不仅是销售机器人,更是销售“大脑”——一个可部署于不同硬件形态(移动机械臂、腿式机器人、专用机械臂)并应用于各行业的统一软件平台。这借鉴了软件巨头的玩法,并将其应用于物理智能。其最接近的类比可能是Covariant,该公司为仓库自动化提供RFM(机器人基础模型)AI平台,但据报道踏石智能专注于世界模型,暗示了其更广泛的泛化雄心。
垂直整合者: 像Boston Dynamics(现属现代汽车集团)和Figure AI(2024年2月融资6.75亿美元)这样的公司,正押注于将尖端硬件与专有AI软件紧密耦合,用于特定、高影响力的应用场景。Figure与宝马在制造业的合作,以及其近期展示的机器人仅凭自然语言指令完成全套咖啡制作流程的演示,都展示了这条集成路径。
科技巨头在位者: 谷歌的DeepMind一直是研究重镇,拥有RT-2和Open X-Embodiment等项目。其战略是开发基础模型并发布数据集以塑造生态系统。NVIDIA凭借其人形机器人基础模型Project GR00T和Isaac仿真平台,正在构建关键的硬件和软件基础设施层,旨在成为具身AI的“芯片与云”提供商。
| 公司 | 主要路径 | 关键产品/项目 | 近期融资/估值 | 目标市场 |
|---|---|---|---|---|
| 踏石智能 | 全栈AI平台(世界模型 + 智能体) | 未公开的平台 | 4.55亿美元(Pre-A轮) | 跨行业通用平台 |
| Covariant | AI平台(机器人基础模型) | RFM(机器人基础模型) | 未公开(C轮后) | 物流与仓库自动化 |
| Figure AI | 垂直整合(人形机器人) | Figure 01 人形机器人 | 6.75亿美元(2024年2月) | 制造业、物流 |
| Boston Dynamics | 垂直整合(先进移动性) | Atlas, Spot, Stretch | 被现代收购 | 工业、研究、公共安全 |
| Google DeepMind | 基础研究与生态塑造 | RT-2, Open X-Embodiment | 母公司支持 | 广泛的研究与生态系统 |
| NVIDIA | 基础设施(芯片/仿真/模型) | Project GR00T, Isaac平台 | 市值驱动 | 全行业基础设施 |