技术深度解析
元界智能的技术路线,刻意偏离了具身机器人领域的两大主流范式:人形通用机器人和工业固定机械臂。相反,该公司构建了一种可称为「厨房原生」的具身智能——一个从零开始设计、能在商业厨房的感官与物理混乱中运行的系统。
对抗性条件下的感知
核心技术挑战在于感知。厨房环境呈现出极端的视觉噪声:蒸汽云团、溅到镜头上的油渍、炒锅火焰造成的波动光线,以及反光的不锈钢表面。在干净数据集上训练的标准计算机视觉模型会在此类场景中彻底失效。元界的解决方案采用了一种多模态感知栈,结合了:
- 热红外摄像头,用于穿透蒸汽和烟雾
- 夹爪上的触觉传感器阵列,用于检测食材质地和熟度
- 本体感觉反馈回路,用于检测湿滑或油腻食材的滑动
- 轻量级LiDAR,用于对杂乱台面进行3D空间映射
「适应混乱」训练范式
与依赖精确定位零件的工厂机器人不同,元界的模型采用仿真到现实(sim2real)迁移与真实厨房数据采集相结合的方式进行训练。仿真环境——基于NVIDIA Isaac Sim构建,并针对油粘度、水表面张力和食材可变形性设置了自定义物理参数——生成了数百万个切菜、翻炒和盛饭的合成训练片段。其关键创新在于一种「域随机化」策略,该策略会改变厨房布局、光照条件、食材形状,甚至地板上的油污量,迫使策略学习鲁棒的行为,而非记忆固定的轨迹。
硬件无关架构
一个关键的架构决策是:元界不自行制造硬件。相反,该公司开发了一个中间件层,可部署在发那科(Fanuc)、ABB等厂商的现有机械臂上,以及优傲机器人(Universal Robots)和节卡(JAKA)等协作机器人制造商的设备上。这种「机器人无关」的方法降低了餐饮连锁店的准入门槛,这些门店可能已经拥有部分自动化基础设施。该具身AI模型输出的是底层关节扭矩指令,而非高层路径点,从而实现了精细的操作能力,能够处理酱料的非牛顿流体动力学或葱段的脆性断裂。
性能基准测试
| 任务 | 人类工人(平均用时) | 元界智能原型 | 传统工业机械臂 |
|---|---|---|---|
| 将1公斤胡萝卜切丁(1厘米立方) | 4分30秒 | 5分10秒 | 8分45秒(需夹具) |
| 炒3份蛋炒饭 | 6分钟 | 7分20秒 | 不适用(无法处理) |
| 摆盘20个饺子 | 1分15秒 | 2分5秒 | 4分30秒(需定制末端执行器) |
| 批次间清洗炒锅 | 45秒 | 1分30秒 | 不适用(非设计用途) |
数据要点: 元界原型在大多数任务上比人类慢15-20%,但在厨房相关任务上已比传统工业机械臂快2-3倍。随着sim2real训练流水线的改进,这一差距正在迅速缩小。
该领域一个值得关注的开源项目是kitchen-robot-env(GitHub,约1,200星),这是一个由加州大学伯克利分校研究人员开发的厨房操作任务仿真环境。虽然无直接关联,但元界很可能借鉴了类似的可变形物体操作技术。
关键参与者与案例研究
元界进入了一个已有多个知名竞争对手和相邻参与者的领域,每家公司在厨房自动化方面都采取了不同的战略路径。
竞争格局
| 公司 | 方法 | 融资阶段 | 关键差异化优势 |
|---|---|---|---|
| 元界智能 | 面向现有机械臂的具身AI中间件 | 种子轮(¥1000万+) | 机器人无关,适应现有厨房 |
| Miso Robotics(美国) | 快餐定制硬件(Flippy) | C轮($1亿+) | 专注于炸炉工位、汉堡翻面 |
| Piestro(美国) | 全自动披萨制作亭 | 种子轮 | 模块化,无需人工 |
| Chef Robotics(美国) | 面向商业厨房的AI驱动机械臂 | A轮($4000万) | 自有机械臂+视觉系统 |
| 深圳「KitchenAI」 | 用于烹饪的人形机器人 | 种子前轮 | 人形形态,极早期阶段 |
案例研究:Miso Robotics的Flippy
Miso Robotics已在美国超过100家White Castle门店部署了Flippy。虽然Flippy成功实现了炸炉工位的自动化——这是一个相对结构化的任务——但该公司在单位经济性上遇到了困难。每台Flippy设备成本约为3万美元,对餐厅经营者而言,其投资回报率取决于高流量的炸物使用量。Miso的经验凸显了一个关键教训:即使是成功的厨房机器人,也必须在12-18个月内实现回本,才能获得广泛采用。元界的中间件方法可以部署在更便宜的机械臂上(约1.5万美元),从而显著缩短回本周期。