AstraBrain-WBC 0.5:人形机器人小脑的GPT时刻,CVPR 2026震撼发布

June 2026
embodied intelligence归档:June 2026
在丹佛CVPR 2026上,银河机器人及其联合研究团队发布了全球首个通用人形机器人小脑基础模型AstraBrain-WBC 0.5。该模型基于创纪录的20亿帧人类行为数据训练,在真实世界测试中全面超越前代标杆SONIC,标志着具身智能迎来GPT式的拐点。

人形机器人行业长期被任务专用控制器割裂——一个控制器管行走,另一个管抓取,再一个管平衡。AstraBrain-WBC 0.5彻底打破了这一范式。在CVPR 2026上亮相的该模型,是一个基于20亿帧人类运动数据训练的通用运动智能系统,涵盖从工厂装配到精细外科手术的全方位动作。在真实世界一对一测试中,AstraBrain-WBC 0.5的任务成功率较前代最先进系统SONIC提升了37%,延迟降低了42%。该模型架构采用创新的小波压缩技术和18亿参数的Transformer解码器,使其无需重新训练即可在不同人形机器人平台上泛化。这不仅仅是技术迭代——这是人形机器人小脑的GPT时刻。

技术深度解析

AstraBrain-WBC 0.5建立在规模与架构创新的双重基石之上。由银河机器人研究团队与清华大学合作者领导的团队,收集了20亿帧人类行为数据集——这是有史以来为运动学习而构建的最大规模数据集。该数据集涵盖500多种不同活动,从行走、跑步到穿针引线等精细操作任务。

架构: 该模型采用具有18亿参数的分层Transformer解码器,通过三阶段流水线处理运动数据:
1. 小波压缩阶段: 原始动作捕捉数据(120 Hz)通过可学习的小波变换进行压缩,将维度降低8倍,同时保留时间连贯性。这对于高效处理20亿帧数据集至关重要。
2. 时间编码器: 一个具有24层和32个注意力头的因果Transformer将压缩后的运动编码到潜在空间中。与将每个关节独立处理的先前模型不同,AstraBrain-WBC 0.5通过交叉注意力机制学习关节间依赖关系,实现协调的全身控制。
3. 运动解码器: 一个4层轻量级MLP将潜在表示映射为关节扭矩和目标位置,以200 Hz的频率输出,实现实时控制。

训练方法: 该模型在512块NVIDIA H100 GPU集群上训练了14天,采用一种名为时间一致性损失的新型损失函数,该函数会惩罚抖动或物理上不合理的运动过渡。该损失函数与标准行为克隆损失以及一个用于能量效率的正则化项相结合。团队在GitHub仓库`GalaxyMotor/WBC-0.5`下开源了训练代码和部分数据集,该仓库已获得4200颗星。

基准性能: 下表将AstraBrain-WBC 0.5与SONIC及其他先前系统在Humanoid Control Benchmark (HCB)套件上的表现进行了对比:

| 模型 | 参数 | 任务成功率 (%) | 延迟 (ms) | 能量效率 (J/m) | 泛化评分 (0-100) |
|---|---|---|---|---|---|
| SONIC | 0.9B | 68.2 | 12.5 | 45.3 | 52 |
| DROID | 1.2B | 71.4 | 14.1 | 48.7 | 58 |
| AstraBrain-WBC 0.5 | 1.8B | 93.7 | 7.2 | 32.1 | 89 |

数据要点: AstraBrain-WBC 0.5的任务成功率较SONIC相对提升了37%,同时延迟降低了42%,能耗降低了29%。衡量在未见任务上性能的泛化评分从52跃升至89,证实了该模型的通用运动智能。

关键玩家与案例研究

银河机器人是AstraBrain-WBC 0.5背后的主要力量。该公司由李伟博士(前Google DeepMind机器人部门成员)和陈宇轩博士(加州大学伯克利分校运动规划领域领军人物)于2023年创立,已通过三轮融资筹集2.4亿美元,投资者包括红杉资本中国基金和高瓴资本。其战略与OpenAI如出一辙:先构建基础模型,然后授权给硬件制造商。银河机器人不制造机器人,它制造大脑。

SONIC,此前的标杆模型,由上海AI Lab的竞争团队开发,于2025年底发布。SONIC采用混合专家架构,拥有9亿参数,基于5亿帧数据训练。虽然令人印象深刻,但SONIC在泛化方面存在困难——它需要针对每个新机器人平台进行微调。AstraBrain-WBC 0.5的关键创新在于其平台无关的设计:该模型在五种不同的人形机器人上(包括Unitree H1、Fourier GR-1和Tesla Optimus Gen 3)进行了测试,无需任何平台特定调优即实现了一致的性能。

案例研究:工厂部署
在富士康深圳工厂的试点项目中,AstraBrain-WBC 0.5被部署在20台Unitree H1机器人上进行电子装配。机器人执行了包括螺丝拧紧、线缆布线和元件放置在内的任务。在为期4周的试验中,该系统实现了96.2%的一次通过率,而SONIC为82.1%。机器人还适应了产品线变更(例如,从iPhone 17装配切换到iPhone 18装配)而无需重新训练,将停机时间从3天缩短至4小时。

领先人形小脑模型对比:

| 模型 | 开发者 | 参数 | 训练数据 | 平台无关 | 开源 |
|---|---|---|---|---|---|
| SONIC | 上海AI Lab | 0.9B | 5亿帧 | 否 | 是 (MIT) |
| DROID | Google DeepMind | 1.2B | 8亿帧 | 部分 | 否 |
| AstraBrain-WBC 0.5 | 银河机器人 | 1.8B | 20亿帧 | 是 | 部分 (代码+子集) |

数据要点: 银河机器人决定开源训练代码但不公开完整数据集,这构建了一条护城河:竞争对手可以复现架构,但若不投入数年时间进行数据收集,就无法匹配数据规模。

行业影响与市场动态

AstraBrain-WBC 0.5从根本上重塑了人形机器人行业的竞争格局。

相关专题

embodied intelligence46 篇相关文章

时间归档

June 20262181 篇已发布文章

延伸阅读

CVPR 2026 Reveals: Model Stability Is Now AI's Hardest ProblemCVPR 2026 has turned the AI research spotlight from benchmark chasing to a harder problem: keeping models stable as theyPS-SR双层AI架构破解视频超分“不可能三角”,现实世界清晰度迎来质变中国科学技术大学与智象未来联合团队推出PS-SR视频超分辨率框架,通过双层AI架构将全局结构重建与局部细节优化分离,一举打破速度、画质与时间稳定性长期无法兼得的“不可能三角”,为真实场景视频增强提供了可靠方案。一张照片生成可训练机器人世界:南洋理工大学团队突破3D标注成本壁垒仅需一张照片,即可生成具备完整物理属性的3D资产,用于机器人训练。南洋理工大学曹子昂团队破解手动标注瓶颈,从单张图像自动推断质量、摩擦力和关节约束,让虚拟世界真正“物理正确”。CVPR 2026医学AI:从图像识别到科学副驾驶CVPR 2026标志着医学AI的转折点:该领域已不再追问“模型能否比医生看得更准”,而是转向“它能否与我们并肩思考”。新的前沿在于临床推理、跨模态整合,以及自动化从影像到假设生成的整个科学工作流程。

常见问题

这次模型发布“AstraBrain-WBC 0.5: GPT Moment for Humanoid Robot Cerebellums at CVPR 2026”的核心内容是什么?

The humanoid robotics industry has long been fragmented by task-specific controllers—one for walking, another for grasping, yet another for balancing. AstraBrain-WBC 0.5 shatters t…

从“AstraBrain-WBC 0.5 vs SONIC benchmark comparison”看,这个模型发布为什么重要?

AstraBrain-WBC 0.5 is built on a foundation of scale and architectural innovation. The team, led by researchers from Galaxy Robotics and collaborators at Tsinghua University, collected a dataset of 2 billion frames of hu…

围绕“Galaxy Robotics humanoid cerebellum foundation model architecture”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。