地瓜机器人27亿美元豪赌具身智能,全球自动化迎来范式转移

地瓜机器人近日完成总额27亿美元的B轮融资,其中最新一笔达15亿美元,创下机器人史上最大单笔投资之一。这笔巨额资本标志着一个深刻的行业转向:从专用自动化迈向能在动态现实场景中运作的通用认知机器。资金将全力推动其机器人即服务(RaaS)模式的全球扩张。

地瓜机器人获得的27亿美元B轮融资,远不止是一个资本里程碑,更是市场对具身智能作为下一代自动化范式的明确背书。在仓储等结构化环境确立主导地位后,地瓜正进行一场战略性转向。其核心目标是攻克非结构化、动态的商业场景——例如从杂乱零件中组装产品,或在陌生零售后仓中导航寻找库存。这要求技术实现从预编程执行器到自适应认知平台的根本性进化。

公司的技术路线图聚焦于将大规模世界模型与鲁棒的智能体架构相融合,赋予实体机器情境理解与实时决策能力。其软件堆栈日益开放与模块化,可能基于或贡献于如Google的RT-2(机器人Transformer 2)架构——该架构协同训练视觉、语言与动作数据,或Open X-Embodiment协作数据集。向RaaS模式的转型需要强大的机队管理与编排软件,类似机器人的Kubernetes,以处理任务分配、故障恢复及部署单元间的集体学习。

此次融资将加速地瓜在物流、轻制造和零售等领域的全球布局,其垂直整合能力与已验证的部署规模构成了显著优势。从仓储起步为其奠定了坚实的硬件平台、海量运营数据和企业信任。一个典型案例可能是将托盘搬运机器人升级为能同时执行周期盘点、识别破损货物和处理收货的多任务平台。在电子产品组装等轻制造场景中,地瓜机器人正被测试执行“配料”任务——从料箱中分拣多样组件并放入托盘以备组装,这需要视觉、灵巧操作和情境适应能力的深度融合。

技术深度解析

地瓜从“执行自动化”向“认知自动化”的转型,依赖于一个整合实时感知、推理与行动的多层技术栈。其架构建立在仿真到现实(Sim2Real)学习世界模型的基础之上,超越了传统的SLAM与路径规划。

其核心是分层智能体架构。一个高层“认知规划器”(很可能由精调的大型语言模型或多模态基础模型驱动)解析自然语言指令(例如“补货第三通道”),并将其分解为抽象子目标。这些目标被传递至中层的“任务与运动规划器”,该规划器在考虑物理特性和物体可供性的前提下,将子目标转化为可执行的行动序列。最后,底层的“控制器”执行精确的运动指令,并通过视觉与力/触觉传感器形成连续反馈回路。创新之处在于高层推理模型与物理动力学模型之间的紧密耦合,使系统能够处理异常与模糊情况。

关键在于神经世界模型的开发与训练。与经典物理模拟器不同,这是一种通过学习得到的、对环境进行压缩表征的模型,能够预测潜在行动的结果。诸如英伟达的Eureka以及开源项目Meta AI的“Habitat”仿真平台(在GitHub上拥有超过4.5k星标)等项目,让我们得以窥见这一范式。地瓜很可能正在开发基于海量机器人交互数据训练的专有变体,使其智能体能够在行动前进行“心理模拟”,这对于在新情境中保障安全与效率至关重要。

软件堆栈正变得越来越开放和模块化。地瓜可能正在利用或贡献于类似Google RT-2(Robotics Transformer 2)的架构(该架构协同训练视觉、语言和动作数据),或Open X-Embodiment协作数据集。向RaaS模式的迈进需要强大的机队管理与编排软件,类似于机器人的Kubernetes,以处理任务分配、故障恢复以及跨部署单元的集体学习。

| 技术组件 | 传统机器人技术 | 地瓜的认知方案 | 关键使能技术 |
|---|---|---|---|
| 规划 | 预定义脚本,有限状态机 | LLM驱动的分层规划,心理模拟 | 多模态基础模型 |
| 感知 | 物体检测,度量SLAM | 语义场景理解,可供性预测 | 视觉-语言-动作(VLA)模型 |
| 控制 | PID,模型预测控制(MPC) | 基于学习的控制(如扩散策略,强化学习) | 大规模模仿/强化学习 |
| 适应 | 手动重新编程 | 基于演示的小样本学习,在线适应 | 仿真到现实迁移,元学习 |

数据要点: 上表阐明了从确定性、硬编码系统向学习型、自适应系统的范式转移。将LLM用于规划、VLA用于感知的整合是关键差异点,使得系统无需为每个场景进行显式编程即可实现跨任务泛化。

关键参与者与案例研究

具身AI领域正围绕少数资金雄厚的竞争者迅速整合,各自策略鲜明。波士顿动力(现属现代汽车旗下)在先进移动性与动态控制(Spot, Atlas)方面表现出色,但其高层认知堆栈和商业RaaS服务尚处早期阶段。获OpenAI、微软和英伟达支持的Figure AI,正押注于人形机器人形态,直接瞄准物流与制造领域的通用目标。特斯拉正在开发Optimus机器人,利用其在真实世界视觉数据方面的巨大优势及规模化制造专长,但其商业化时间表仍不确定。

在物流领域的RaaS模式中,Locus Robotics6 River Systems(已被Ocado收购)是成熟玩家,但它们专注于仓库内特定物料搬运任务的自主移动机器人(AMR)——这比地瓜更广泛的雄心更为局限。拥有Phoenix人形机器人的Sanctuary AI以及推出Apollo的Apptronik,也在角逐通用操作市场。

地瓜的明显优势在于其垂直整合与经过验证的部署规模。从仓储起步为其提供了坚实的硬件平台、海量运营数据和企业信任。其典型案例可能涉及将托盘搬运机器人演进为也能执行周期盘点、识别破损货物和处理收货的机器——在单一平台上完成多项任务。RaaS模式正在轻制造领域接受测试,例如电子产品组装,地瓜机器人可被委以“配料”任务——从料箱中收集不同组件并放入托盘以备组装——这项工作需要视觉、灵巧操作和情境理解的深度融合。

延伸阅读

中国数据驱动的具身AI如何通过消费级硬件重塑机器人未来“抱抱脸”机器人的爆火不仅是消费电子产品的胜利,更标志着一场由中国人主导的人工智能范式革命。其核心在于“数据驱动的具身智能”路径——通过大众硬件收集海量物理交互数据,为训练通用机器人智能体奠定基石,标志着AI重心从云端模型向物理世界的决定性中国AI领军者战略转向:从刷榜竞赛到商业落地,全面聚焦智能体与世界模型中国AI产业正经历一场深刻的战略调整。月之暗面创始人杨植麟近期主持的一场高层圆桌会议释放出明确信号:行业正集体从纯粹的模型能力竞赛,转向攻克部署、可靠性与商业化等硬核难题。这标志着中国AI进入一个务实、价值驱动的新阶段。OpenAI 关闭 Sora:从视频生成到世界模型的战略转向OpenAI 做出了一项决定性战略调整,正式终止了其开创性的文生视频模型 Sora。这款发布仅 25 个月便戛然而止的明星产品,标志着行业正经历深刻重组:从资源密集型的生成奇观,转向构建用于推理与行动的基础架构。RoboChallenge Table30 V2:具身AI泛化危机的新熔炉具身AI领域迎来新北极星。RoboChallenge Table30 V2这一要求前所未有的泛化能力的标准化物理测试平台,正在重新定义研究进展的衡量标准。它超越脚本化任务,直接评估智能体在新场景中适应、推理与应用所学概念的核心能力,直面该领

常见问题

这次公司发布“Digua Robotics' $2.7B Bet on Embodied AI Signals Major Shift in Global Automation”主要讲了什么?

The $2.7 billion Series B financing for Digua Robotics represents far more than a capital milestone; it is a definitive market endorsement of embodied intelligence as the next para…

从“Digua Robotics RaaS pricing model details”看,这家公司的这次发布为什么值得关注?

Digua's pivot from "execution automation" to "cognitive automation" hinges on a multi-layered technical stack that integrates perception, reasoning, and action in real-time. The architecture is built upon a foundation of…

围绕“Digua Robotics vs Boston Dynamics technology comparison”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。