技术深度解析
SpaceX的核心卖点是“轨道计算节点”(OCN)——一组搭载在改装版Starlink卫星总线上的AI加速器机架。该架构看似简单,但执行起来极其困难。每个OCN设计在真空中运行,通过辐射面板散热,并由可展开的太阳能阵列供电,每个节点可产生50-100千瓦电力。关键创新不在于硬件,而在于网络:一个激光星间链路(ISL)网状网络,承诺星座内任意两个节点间延迟低于10毫秒,到地球任何地面站的延迟低于20毫秒。
架构分解:
- 计算: 基于特斯拉Dojo D1芯片的辐射强化变体定制的ASIC,针对Transformer模型中常见的稀疏矩阵运算进行了优化。每个节点集成1024个类D1核心,每个节点提供约2.5 PFLOPS(FP16)。
- 电力: 效率达40%的三结砷化镓太阳能电池,辅以固态锂陶瓷电池用于日食期间(每90分钟轨道周期中约45分钟)。
- 散热: 使用可展开的碳复合材料散热器进行被动辐射冷却,能够在85°C下耗散80千瓦热量。不采用液冷——这是有意为之,以减少单点故障风险。
- 网络: 采用相控阵捕获系统的200 Gbps激光星间链路。该星座计划在550公里高度部署12,000个OCN,形成每个节点拥有6-8条链路的环形网状网络。
与地面基础设施的对比:
| 指标 | 地面数据中心(AWS p5.48xlarge集群) | SpaceX OCN(单节点) |
|---|---|---|
| 每机架功耗 | 40-50 kW | 80 kW(太阳能) |
| 每千瓦冷却成本 | 150-200美元/月 | 0美元(辐射冷却) |
| 每兆瓦土地成本 | 50万-200万美元(城市) | 0美元(轨道) |
| 用户延迟(全球平均) | 30-80 ms | 15-25 ms(通过Starlink) |
| 碳足迹 | 高(依赖电网) | 零(太阳能) |
| 可靠性(正常运行时间) | 99.99% | 99.5%(预估,受太阳耀斑影响) |
数据要点: OCN在冷却和土地成本上实现了巨大节省,但代价是可靠性和维护复杂性的降低。功率密度更高,但每美元的总算力尚未得到验证。
一个值得关注的相关开源项目是GitHub上的Orbital Compute Initiative(仓库:`orbital-compute/simulator`),该项目已获得2300颗星,用于模拟跨卫星网状网络的AI训练任务调度。它揭示了一个关键瓶颈:检查点。在1000个OCN上进行单次训练运行需要每小时保存超过10 TB的模型权重,而下行链路带宽(目前每颗卫星10 Gbps)将成为瓶颈。
关键技术挑战: 范艾伦辐射带。在550公里高度,辐射水平是地球表面的10倍。如果没有主动屏蔽,AI加速器中的SRAM单元每2-3小时就会发生单粒子翻转(比特翻转)。SpaceX声称三重冗余投票架构和定期清洗可以缓解这一问题,但从未在这种环境下进行过大规模AI训练。消费级电子设备在近地轨道上的年故障率为5-10%;SpaceX押注于定制辐射强化设计,以实现低于1%的故障率。
要点: 技术愿景是连贯的,但尚未在大规模上得到验证。真正的创新在于网络层,而非计算本身。如果辐射问题得到解决,轨道网状网络可能成为全球AI推理延迟最低的骨干网——但训练仍然遥不可及。
关键参与者与案例研究
SpaceX并非这一愿景的唯一践行者。多家公司正竞相构建太空计算能力,但没有一家具备SpaceX的垂直整合能力。
| 公司 | 方法 | 状态 | 融资额 | 关键差异化优势 |
|---|---|---|---|---|
| SpaceX (OCN) | 定制ASIC + Starlink网状网络 | IPO阶段,原型于2025年在国际空间站测试 | 750亿美元以上(IPO) | 自有发射、自有网络、自有芯片 |
| Lumen Orbit | 在CubeSat中使用现成NVIDIA GPU | 2025年发射3颗演示卫星 | 4000万美元A轮 | 成本更低,迭代更快 |
| Aethero | 辐射容忍FPGA集群 | 2024-2025年两次试飞 | 1200万美元种子轮 | 专注于推理而非训练 |
| Cloud Constellation | 数据中继 + 边缘计算 | 推迟,寻求2亿美元 | 总计8500万美元 | 与AWS合作进行地面集成 |
案例研究:Lumen Orbit 2025年演示
2025年11月,Lumen Orbit发射了三颗12U CubeSat,每颗搭载一个NVIDIA Jetson Orin AGX。它们成功运行了一个小型LLM(Llama 3.2 1B)进行推理,达到了每秒15个token——对于10瓦设备来说令人印象深刻,但比SpaceX承诺的性能低几个数量级。该演示证明了该概念对于边缘推理是可行的,但突显了散热挑战:CubeSat在连续推理12分钟后过热,被迫冷却30分钟。Lumen目前正在开发类似于SpaceX设计的可展开散热器。
案例研究:Aethero的FPGA方法
Aethero由前NASA JPL工程师创立,使用辐射容忍FPGA(Xilin