技术深度解析
AstraBrain-WBC 0.5建立在规模与架构创新的双重基石之上。由银河机器人研究团队与清华大学合作者领导的团队,收集了20亿帧人类行为数据集——这是有史以来为运动学习而构建的最大规模数据集。该数据集涵盖500多种不同活动,从行走、跑步到穿针引线等精细操作任务。
架构: 该模型采用具有18亿参数的分层Transformer解码器,通过三阶段流水线处理运动数据:
1. 小波压缩阶段: 原始动作捕捉数据(120 Hz)通过可学习的小波变换进行压缩,将维度降低8倍,同时保留时间连贯性。这对于高效处理20亿帧数据集至关重要。
2. 时间编码器: 一个具有24层和32个注意力头的因果Transformer将压缩后的运动编码到潜在空间中。与将每个关节独立处理的先前模型不同,AstraBrain-WBC 0.5通过交叉注意力机制学习关节间依赖关系,实现协调的全身控制。
3. 运动解码器: 一个4层轻量级MLP将潜在表示映射为关节扭矩和目标位置,以200 Hz的频率输出,实现实时控制。
训练方法: 该模型在512块NVIDIA H100 GPU集群上训练了14天,采用一种名为时间一致性损失的新型损失函数,该函数会惩罚抖动或物理上不合理的运动过渡。该损失函数与标准行为克隆损失以及一个用于能量效率的正则化项相结合。团队在GitHub仓库`GalaxyMotor/WBC-0.5`下开源了训练代码和部分数据集,该仓库已获得4200颗星。
基准性能: 下表将AstraBrain-WBC 0.5与SONIC及其他先前系统在Humanoid Control Benchmark (HCB)套件上的表现进行了对比:
| 模型 | 参数 | 任务成功率 (%) | 延迟 (ms) | 能量效率 (J/m) | 泛化评分 (0-100) |
|---|---|---|---|---|---|
| SONIC | 0.9B | 68.2 | 12.5 | 45.3 | 52 |
| DROID | 1.2B | 71.4 | 14.1 | 48.7 | 58 |
| AstraBrain-WBC 0.5 | 1.8B | 93.7 | 7.2 | 32.1 | 89 |
数据要点: AstraBrain-WBC 0.5的任务成功率较SONIC相对提升了37%,同时延迟降低了42%,能耗降低了29%。衡量在未见任务上性能的泛化评分从52跃升至89,证实了该模型的通用运动智能。
关键玩家与案例研究
银河机器人是AstraBrain-WBC 0.5背后的主要力量。该公司由李伟博士(前Google DeepMind机器人部门成员)和陈宇轩博士(加州大学伯克利分校运动规划领域领军人物)于2023年创立,已通过三轮融资筹集2.4亿美元,投资者包括红杉资本中国基金和高瓴资本。其战略与OpenAI如出一辙:先构建基础模型,然后授权给硬件制造商。银河机器人不制造机器人,它制造大脑。
SONIC,此前的标杆模型,由上海AI Lab的竞争团队开发,于2025年底发布。SONIC采用混合专家架构,拥有9亿参数,基于5亿帧数据训练。虽然令人印象深刻,但SONIC在泛化方面存在困难——它需要针对每个新机器人平台进行微调。AstraBrain-WBC 0.5的关键创新在于其平台无关的设计:该模型在五种不同的人形机器人上(包括Unitree H1、Fourier GR-1和Tesla Optimus Gen 3)进行了测试,无需任何平台特定调优即实现了一致的性能。
案例研究:工厂部署
在富士康深圳工厂的试点项目中,AstraBrain-WBC 0.5被部署在20台Unitree H1机器人上进行电子装配。机器人执行了包括螺丝拧紧、线缆布线和元件放置在内的任务。在为期4周的试验中,该系统实现了96.2%的一次通过率,而SONIC为82.1%。机器人还适应了产品线变更(例如,从iPhone 17装配切换到iPhone 18装配)而无需重新训练,将停机时间从3天缩短至4小时。
领先人形小脑模型对比:
| 模型 | 开发者 | 参数 | 训练数据 | 平台无关 | 开源 |
|---|---|---|---|---|---|
| SONIC | 上海AI Lab | 0.9B | 5亿帧 | 否 | 是 (MIT) |
| DROID | Google DeepMind | 1.2B | 8亿帧 | 部分 | 否 |
| AstraBrain-WBC 0.5 | 银河机器人 | 1.8B | 20亿帧 | 是 | 部分 (代码+子集) |
数据要点: 银河机器人决定开源训练代码但不公开完整数据集,这构建了一条护城河:竞争对手可以复现架构,但若不投入数年时间进行数据收集,就无法匹配数据规模。
行业影响与市场动态
AstraBrain-WBC 0.5从根本上重塑了人形机器人行业的竞争格局。