优必选联姻沐曦:国产“大脑”能否打破人形机器人的GPU枷锁?

June 2026
归档:June 2026
历经17年磨砺的“人形机器人第一股”优必选,与GPU新锐沐曦达成战略合作,共同研发人形机器人专用芯片。此举旨在打造完全自主的国产“大脑”,有望打破行业对海外高端芯片的依赖,为大规模商业化扫清关键障碍。

总部位于深圳的机器人先驱优必选(旗下拥有Walker和熊猫机器人等产品)宣布与成立仅五年的GPU设计公司沐曦建立战略合作伙伴关系。后者已迅速成长为中国半导体领域的有力竞争者。双方将联合开发一款专为人形机器人感知与控制而设计的系统级芯片(SoC)。这并非简单地将外国GPU替换为国产芯片,而是对计算底层的彻底重构。当前的人形机器人,如特斯拉的Optimus或波士顿动力的Atlas,均依赖NVIDIA Jetson或Orin系列等通用GPU,这些芯片针对通用AI工作负载进行了优化。优必选与沐曦的目标是打造一个“机器人大脑”,集成用于实时视觉和语言的神经网络处理单元(NPU)、一个专为运动控制设计的处理器,以及一个独立的视觉流水线,从而在单一芯片上实现从感知到动作的端到端闭环。

技术深度解析

人形机器人领域的核心挑战在于“实时感知-动作循环”。一个人形机器人必须以30-60 FPS的速率捕捉摄像头画面,运行目标检测(如YOLOv8),计算3D占据网格,规划运动轨迹,并向关节发送指令——所有这些都必须在10-20毫秒的时间窗口内完成,以维持身体平衡。当前的解决方案依赖于异构计算堆栈:一个用于AI推理的NVIDIA Jetson Orin、一个用于电机控制的STM32或类似MCU,以及一个用于安全互锁的独立FPGA。这种架构造成了延迟瓶颈和能效低下。

优必选与沐曦的策略是构建一个统一的SoC,将这些层级整合在一起。该架构可能包含:
- 一个多核NPU,配备用于矩阵运算的脉动阵列,支持稀疏计算和混合精度(FP8、INT4),以降低内存带宽需求。
- 一个专用运动控制处理器,通过硬件加速实现逆运动学、雅可比矩阵计算和力反馈闭环。这一点至关重要:人形机器人拥有20-40个自由度,每个关节都需要一个以1-4 kHz频率运行的控制回路。
- 一个视觉流水线,配备用于立体深度估计和视觉里程计的专用硬件,绕过CPU进行底层图像处理。
- 一个安全协处理器,独立于主计算单元,监控关节扭矩限制、电池温度和紧急停止信号。

根据公开信息,沐曦的MXN架构采用统一内存架构,允许NPU和GPU在不通过PCIe复制数据的情况下共享数据,从而降低延迟。该公司已在GitHub上发布了多个仓库(例如,`muxi-npu-driver`,一个用于NPU调度的Linux内核模块,获得了1200颗星),展示了其对开源工具链的承诺。他们还提供了一款自定义编译器`muxi-cc`,可将PyTorch和ONNX模型映射到其硬件上。

| 基准测试 | NVIDIA Jetson Orin (60W) | 沐曦 MXN-2 (55W, 估计值) | 优必选-沐曦定制SoC (目标) |
|---|---|---|---|
| ResNet-50 (FP16, 图像/秒) | 1,200 | 980 | 1,100 (目标) |
| YOLOv5s (FP16, FPS) | 180 | 150 | 200 (目标) |
| 功耗 (空闲) | 15W | 12W | 8W (目标) |
| 运动控制延迟 (μs) | 500 (通过CPU) | 不适用 | 50 (专用硬件) |
| 芯片面积 (mm²) | 200 | 180 | 250 (集成后) |

数据解读: 定制SoC的关键优势并非原始AI吞吐量,而是运动控制的集成,这将延迟降低了一个数量级。这正是机器人踉跄行走与在崎岖地形上平稳行走之间的区别。

关键玩家与案例分析

优必选 (UBTECH Robotics, 9880.HK) 一直是中国在人形机器人领域野心的风向标。其Walker系列(Walker、Walker X、Walker S)已部署在博物馆、学校和工厂中。然而,该公司一直面临盈利挑战——其2023年年报显示营收为11.2亿元人民币(1.55亿美元),但净亏损达12.7亿元人民币。与沐曦的合作是一项战略性垂直整合举措,旨在降低物料清单(BOM)成本。目前,Walker S使用的是NVIDIA Jetson AGX Orin,每颗成本约为1500美元。定制SoC有望将这一成本降至300美元以下,从而大幅改善利润率。

沐曦 (Muxi Technology) 由前AMD和海思工程师于2019年创立。该公司已从红杉中国和联想创投等投资者处融资超过8亿元人民币(1.1亿美元)。其于2024年发布的MXN-2 GPU面向边缘AI,提供16 TOPS(INT8)算力,并支持PCIe 4.0。虽然其数据中心工作负载性能无法与NVIDIA H100竞争,但其能效和可编程性使其非常适合机器人领域。该公司还开发了ROS 2(机器人操作系统)集成包,使开发者能够以最少的代码更改部署感知模型。

竞争路径对比:

| 公司 | 芯片策略 | 状态 | 关键优势 |
|---|---|---|---|
| 特斯拉 (Optimus) | 定制SoC (源自Dojo) | 内部使用,不对外销售 | 与FSD堆栈紧密集成 |
| NVIDIA (Jetson Thor) | 通用AI + GPU | 现已上市 | 成熟的生态系统 (Isaac Sim) |
| 地平线 (征程 6) | 领域专用NPU | 2025年量产 | 在自动驾驶领域实力强劲 |
| 优必选-沐曦 | 定制人形机器人SoC | 2026年原型 | 运动控制协处理器 |

数据解读: 特斯拉的定制化方法堪称黄金标准,但封闭不开放。NVIDIA的生态系统锁定效应强大。优必选与沐曦的赌注在于,一种专门化、开放架构的芯片能够抓住新兴的中国机器人供应链,该供应链对价格敏感且高度重视安全性。

行业影响与市场动态

根据行业估计,人形机器人市场预计将从2024年的15亿美元增长到2030年的280亿美元(年复合增长率52%)。在政府补贴和对自动化需求旺盛的制造业推动下,中国预计将占据该市场的35%。然而,瓶颈一直是计算成本。目前,一台典型的人形机器人承载着2000至4000美元的计算成本。优必选与沐曦的合作,有望将这一成本削减一半以上,从而加速人形机器人在制造、物流和服务等领域的规模化部署。

时间归档

June 20261209 篇已发布文章

延伸阅读

微软股价暴跌:AI蜜月期终结,盈利压力骤增本周微软股价承压,折射出市场风向的深刻转变——投资者不再满足于宏大的AI叙事,而是要求真金白银的回报。巨额资本开支与Copilot等产品缓慢的变现速度之间的鸿沟,正成为市场审视的焦点。AI三重战线:语音霸权、平台垄断与2000亿美元信任危机本周,AI行业在三条战线上同时爆发:OpenAI推出GPT-Realtime争夺语音主导权,Anthropic因限制自家Mythos模型性能引发平台垄断争议,Google Gemini被武器化用于生成虚假广告,威胁到2000亿美元的收入流。纽约茶坊、鬼塚虎独立:消费品牌的新零售棋局本周,消费巨头们动作频频:喜茶在纽约开出首家海外“茶坊”,亚瑟士正式分拆鬼塚虎,星巴克中国推出袋装咖啡进军家庭场景。这些举措,连同AI Agent合作与沉浸式零售概念,共同宣告品牌进化进入新纪元——从卖产品到卖体验、卖文化、卖场景。中国AI模型中文称霸全球遇冷:“数据孤岛”危机浮现中国大语言模型在国内基准测试中成绩斐然,但AINews调查发现,一个致命弱点正在浮现:缺乏多元化的全球数据,正催生出“高基准、低鲁棒性”的悖论,威胁着这些模型的长期生命力。

常见问题

这次公司发布“UBTECH and Muxi Join Forces: Can a Domestic Brain Break Humanoid Robot's GPU Shackles?”主要讲了什么?

UBTECH, the Shenzhen-based pioneer behind the Walker and Panda robots, has announced a strategic partnership with Muxi, a five-year-old GPU design house that has rapidly emerged as…

从“UBTECH Muxi chip architecture details”看,这家公司的这次发布为什么值得关注?

The core challenge in humanoid robotics is the 'real-time perception-action loop.' A humanoid must capture camera frames at 30-60 FPS, run object detection (e.g., YOLOv8), compute a 3D occupancy map, plan a trajectory, a…

围绕“humanoid robot GPU alternatives NVIDIA”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。