马斯克弃地面AI模型，豪赌轨道计算未来

埃隆·马斯克已悄然但果断地调整其AI战略，不再参与拥挤的地面大语言模型竞争。相反，他现在押注于一个大胆的愿景：构建一个由太阳能供电、太空真空冷却、并通过星链星座连接的轨道数据中心网络。此举并非简单的业务转向——而是对AI基础设施的根本性重构。其核心洞察在于，对于某些高价值AI工作负载——尤其是实时自主系统、全球传感器融合和机器人世界模型——光纤中的光速已成为瓶颈。太空提供了近光速的真空传播、无限的太阳能以及被动辐射冷却，可将能源成本降低一个数量级。

技术深度解析

转向轨道计算依赖于三大技术支柱：抗辐射硅片、真空热管理以及用于低延迟数据传输的卫星间激光链路。

抗辐射加固： 标准地面GPU，如NVIDIA H100或AMD MI300X，并非为太空环境设计。宇宙射线和太阳粒子会导致单粒子翻转（比特翻转）和闩锁失效。据报道，马斯克的团队正与AMD合作，采用其CDNA架构的定制变体，利用7nm工艺，在寄存器级别集成纠错码（ECC），并对关键控制逻辑采用三模冗余（TMR）。开源社区也做出了贡献：基于RISC-V的“Chipyard”框架（GitHub仓库：ucb-bar/chipyard，4.2k星标）提供了一种设计抗辐射处理器的模块化方法，但尚未适配至航天级GPU集群。关键权衡在于，冗余会将有效计算密度降低约30-50%，这意味着每个轨道GPU节点提供的原始FLOPs将低于其地面同类产品。

热管理： 在太空中，不存在对流冷却。热量必须通过辐射散发。SpaceX正在开发可展开的散热板，涂有高发射率材料（例如碳纳米管黑漆），每平方米可耗散高达10千瓦的热量。相比之下，地面数据中心通常每平方米地板面积需要0.5-1千瓦用于冷却。真空环境还允许采用可在较低压力下运行、效率更高的被动两相冷却回路。然而，轨道白天（260°F）与夜晚（-200°F）之间的热循环会对焊点和热界面材料造成应力，需要采用新型相变材料（PCM）来缓冲温度波动。

卫星间链路： Starlink v2.0卫星已使用每链路200 Gbps的激光交叉链路。对于AI推理，关键指标是往返时间（RTT）。一颗位于550公里高度低地球轨道（LEO）的卫星，到其正下方地面站的单向延迟约为1.8毫秒。但对于地球两端的两个用户，经由单颗卫星的路径延迟约为10毫秒（而通过地面光纤约为100毫秒）。对于跨多个轨道节点的分布式推理，卫星之间的延迟每跳约为0.5毫秒。这使得轨道计算特别适用于需要全球协调的实时AI代理，例如自主无人机集群或高频交易算法。

| 指标 | 地面数据中心 (AWS us-east-1) | 轨道数据中心 (LEO, 550 km) |
|---|---|---|
| 往返延迟 (纽约到东京) | ~110 毫秒 | ~12 毫秒 (通过激光链路) |
| 每FLOP能源成本 | ~0.05 美元/千瓦时 (美国平均) | ~0.02 美元/千瓦时 (太阳能+电池) |
| 冷却开销 | 总功率的30-40% | 5-10% (被动辐射) |
| 每机架单元计算密度 | 20-40 TFLOPS (FP16) | 10-20 TFLOPS (辐射降级后) |
| 每公斤发射成本 | 不适用 | $2,500 (Falcon 9) 至 $1,000 (Starship) |

数据要点： 对于全球范围的实时应用，轨道计算的延迟优势毋庸置疑，但抗辐射加固带来的计算密度惩罚以及当前高昂的发射成本意味着，在可预见的未来，地面中心仍将在批处理与训练领域占据主导地位。

关键参与者与案例研究

SpaceX 与 Starlink： 显而易见的中心参与者。Starlink已有超过6,000颗在轨卫星，并计划扩展至42,000颗。每颗v2.0卫星都搭载了相控阵天线和激光终端。马斯克曾暗示，未来的Starlink卫星将携带“星载计算”用于边缘AI，但转向专用GPU集群是一次重大升级。首个测试平台预计将是由一枚Falcon 9火箭发射的12颗卫星组成的集群，每颗卫星搭载一颗定制的AMD Instinct MI300X衍生芯片，配备128 GB HBM3内存，每颗卫星提供约1.5 PFLOPS（FP16）算力。

AMD 与 NVIDIA： AMD凭借其CDNA架构积极争夺太空市场，该架构在某些工作负载上提供了优于NVIDIA Hopper的每瓦计算性能。与此同时，NVIDIA拥有面向边缘设备的“Jetson Orin”产品线，但尚未公开追求轨道级芯片。开源的ROCm软件栈（GitHub仓库：ROCm/ROCm，4.5k星标）在此至关重要，因为它允许SpaceX为抗辐射环境定制驱动和运行时，而无需受限于NVIDIA专有的CUDA生态。AINews预测，鉴于AMD愿意共同设计定制芯片，它将成为轨道AI的主要硅合作伙伴。

| 公司 | 产品 | 算力 (FP16) | 功耗 (W) | 抗辐射能力 |
|---|---|---|---|---|
| NVIDIA | H100 | 1,979 TFLOPS | 700 W | 无 (地面) |
| AMD | MI300X | 1,307 TFLOPS | 750 W | 无 (地面) |
| SpaceX/AMD | 定制轨道GPU | ~500 TFLOPS (估计) | 400 W | 单粒子翻转容忍 (TMR) |
| Intel | Ponte Vecchio | 1,200 TFLOPS | 600 W | 无 |

时间归档

延伸阅读

常见问题

这次公司发布“Elon Musk Abandons Ground AI Models to Bet on Orbital Computing Future”主要讲了什么？

Elon Musk has quietly but decisively shifted his AI strategy away from competing in the crowded ground-based large language model arena. Instead, he is now betting the farm on an a…

从“how does orbital computing reduce AI inference latency”看，这家公司的这次发布为什么值得关注？

The pivot to orbital computing hinges on three technical pillars: radiation-hardened silicon, thermal management in vacuum, and inter-satellite laser links for low-latency data transfer. Radiation Hardening: Standard ter…

围绕“radiation hardened GPU chips for space applications”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。