技术深度解析
这里的核心创新在于创建了有史以来为具身AI建造的最大物理模拟环境。虽然合成数据和受控实验室环境(如NVIDIA Isaac Sim或Meta Habitat)一直是机器人训练的支柱,但它们存在“仿真到现实”的鸿沟:在完美数字世界中训练的模型面对真实家庭的混乱时往往失败。该项目直接解决了这一问题,提供了30万套真实公寓,拥有真实的缺陷:粘稠的地板、歪斜的抽屉、多变的光照条件和意外的杂乱。
架构与工程: 这些房屋正在改造中,配备标准化的传感器和基础设施层。包括:
- 嵌入传感器的地板: 压力敏感瓷砖,可追踪机器人移动、重量分布和跌倒,精度达亚厘米级。
- 模块化墙壁与固定装置: 可互换的厨房橱柜、门把手和台面,可更换以改变任务难度。这允许系统化的课程学习——从简单的空厨房开始,逐步过渡到杂乱的厨房。
- 集中式计算与充电: 每个单元都有一个标准化的充电底座和一个本地边缘计算节点(可能基于NVIDIA Jetson或类似产品),用于处理设备端推理和数据记录,减少实时控制回路的延迟。
- 数据管道: 每次交互都被记录:关节角度、力扭矩、视觉反馈和成功/失败状态。这些数据被流式传输到中央云进行模型再训练,形成持续反馈循环。
与现有仿真平台的比较:
| 平台 | 环境类型 | 规模 | 真实感 | 成本 | 关键限制 |
|---|---|---|---|---|---|
| NVIDIA Isaac Sim | 合成 | 无限(虚拟) | 高(渲染) | GPU计算成本 | 仿真到现实鸿沟持续存在 |
| Meta Habitat 3.0 | 合成 + 真实扫描 | 1000+虚拟住宅 | 中等 | 开源 | 无物理交互 |
| Google RT-2实验室 | 受控真实实验室 | ~10个房间 | 非常高 | 高设置成本 | 多样性有限 |
| 本项目 | 真实物理住宅 | 30万套单元 | 完美(真实世界) | 按训练时间付费 | 规模与维护成本 |
数据要点: 表格显示,虽然合成平台以低边际成本提供无限规模,但它们无法完全复制真实物理的随机性。该项目提供了规模化的“完美真实感”,但运营成本显著更高。如果它能将仿真到现实鸿沟减少哪怕20%,这种权衡就是可接受的。
相关开源仓库: 虽然项目本身是专有的,但社区可以关注相关的开源努力:
- Habitat-Lab (Meta):一个在3D环境中训练具身智能体的平台。它在GitHub上有超过2500颗星,是最接近的开源类比,尽管缺乏物理硬件集成。
- MuJoCo (Google DeepMind):用于机器人仿真的物理引擎。它轻量级,但并非为多智能体、大规模物理部署设计。
- RoboSuite (Stanford):一套标准化的机器人操作环境。它有约1800颗星,专注于可重复的基准测试,该项目可为其训练课程采用。
关键参与者与案例研究
该项目的开发商是一家面临住房供应过剩困境的中国中型房地产集团。通过转向AI基础设施,他们正在重新利用未售出的库存。关键合作伙伴包括:
- 开发商(本报告中未具名,但在业内被称为“HousingAI Group”): 他们提供物理资产和改造。其策略是以高于住宅租赁的利润率变现闲置平方英尺。每单元改造估计成本:5000-10000美元用于传感器和计算节点。
- 机器人公司: 早期采用者包括国内中国公司,如追觅科技(以扫地机器人闻名)和宇树科技(四足和人形机器人)。他们正在使用厨房进行操作任务,使用走廊进行导航。据传波士顿动力和特斯拉Optimus有外国兴趣,但未确认。
- AI实验室: 北京通用人工智能研究院(BIGAI) 是已确认的合作伙伴,使用该环境测试其具身智能的“通测试”。他们特别对“杂乱厨房”场景的泛化感兴趣。
机器人训练方法比较:
| 公司 | 训练方法 | 环境 | 每机器人小时成本 | 数据质量 |
|---|---|---|---|---|
| 特斯拉 (Optimus) | 远程操作 + 仿真 | 工厂车间 + 合成 | ~50美元(估计) | 特定任务高 |
| Google DeepMind (RT-2) | 网络规模视频 + 实验室 | 受控实验室 | ~100美元(估计) | 中等(实验室偏差) |
| 本项目 | 物理真实世界 | 30万套住宅 | 15-30美元(估计) | 非常高(真实世界) |