太空服务器:AI算力的下一个前沿,还是十亿美元的幻影?

May 2026
归档:May 2026
一批初创公司正押注于太空的寒冷真空能解决AI对能源和延迟的无尽需求。但我们的深度调查揭示,轨道的物理现实——宇宙辐射、热管理以及每公斤数千美元的发射成本——可能将太空计算的美梦变成一场代价高昂的幻影。

将数据中心送入轨道的想法不再是科幻小说。像Lumen Orbit、Axiom Space以及几家隐秘初创公司已开始向国际空间站和专用低地球轨道(LEO)卫星发射原型计算模块。其卖点诱人:24/7太阳能供电、近乎绝对零度的环境温度实现被动冷却、以及通过激光星间链路实现地球任意点亚毫秒级延迟。对于延迟敏感的AI推理任务——如自主无人机的实时视频生成、或海事和偏远采矿作业的基于边缘的大语言模型(LLM)响应——其价值主张显而易见。然而,技术障碍巨大。标准服务器级芯片是为地球受保护的磁场环境设计的,在太空中面临严峻挑战。

技术深度解析

太空计算的核心挑战并非将硬件送入轨道——而是让它在轨存活并高效运行。

抗辐射加固 vs. 软件缓解

标准AI加速器(NVIDIA H100/B200、AMD MI300X)采用先进工艺节点(4–5纳米)制造,晶体管尺寸极小。在太空中,来自宇宙射线和太阳耀斑的高能质子和重离子可能导致单粒子闩锁(SEL)摧毁芯片,或单粒子翻转(SEU)破坏寄存器或DRAM中的数据。传统方法是使用抗辐射加固(rad-hard)芯片,它们采用更大的特征尺寸(例如28纳米或65纳米)和特殊电路设计(如三模冗余)。然而,抗辐射芯片在代际上落后于商用部件——最先进的抗辐射FPGA,Xilinx(现AMD)Kintex UltraScale XQRKU060,基于20纳米工艺,其AI推理吞吐量仅为现代GPU的约十分之一。

一种由Cosmic Shielding Corporation和Zero Error Systems等初创公司开创的新方法,采用基于软件的纠错:在商用芯片上运行同一模型的多个副本,通过多数投票检测并纠正SEU。这种方法对推理有效,但会使有效计算成本翻倍或三倍。对于训练,其开销过高,因为梯度更新对数据损坏极为敏感。

真空中的热管理

在地球上,数据中心依赖强制风冷或液冷。在太空中,没有空气。唯一的散热机制是辐射冷却——向深空发射红外光子。斯特藩-玻尔兹曼定律表明,一个300K(27°C)的黑体辐射体每平方米仅能耗散约460瓦。一块H100 GPU在负载下功耗可达700瓦。要冷却一个包含8块GPU(5.6千瓦)的机架,需要大约12平方米的散热器面积——比卫星本体还大。Lumen Orbit等公司正在试验可展开散热面板和相变材料(PCM),后者在峰值负载时吸收热量,在空闲时段辐射出去,但这增加了质量和复杂性。

轨道延迟 vs. 光纤

支持者声称,对于长距离连接,LEO计算的延迟低于光纤,因为光在真空中(299,792公里/秒)比在玻璃光纤中(约200,000公里/秒)传播更快。对于纽约用户向悉尼服务器发送请求,光纤路径约16,000公里(往返80毫秒)。一颗500公里高度的LEO卫星通过星间激光链路理论上可在约40毫秒内路由同一请求。然而,这一优势仅对超过2,000公里的路径成立。对于区域推理(例如旧金山用户查询托管在俄勒冈州的模型),地面光纤更快且更便宜。

数据表:计算性能对比

| 指标 | 地面(H100集群) | LEO抗辐射(XQRKU060) | LEO商用+ECC(H100) |
|---|---|---|---|
| 推理吞吐量(LLaMA-70B tokens/秒) | 1,200 | 15 | 900(带3倍冗余) |
| 每GPU功耗(W) | 700 | 25 | 700 |
| 每GPU散热器质量(kg) | 0 | 15 | 15 |
| 每GPU发射成本($) | 0 | $15,000 | $15,000 |
| 预期寿命(年) | 10 | 7 | 5 |
| SEU率(错误/GPU/年) | <0.01 | <0.001 | ~50(已纠正) |

数据要点: 使用商用GPU配合软件纠错可提供有竞争力的推理吞吐量,但由于发射和散热器质量,总拥有成本(TCO)高出10倍。抗辐射方案对于现代LLM来说速度太慢。目前,这两条路径对通用AI都不具备经济可行性。

关键玩家与案例研究

Lumen Orbit(华盛顿州雷德蒙德)是最引人注目的玩家。由前SpaceX和微软工程师创立,他们于2024年向国际空间站发射了一个原型计算模块。其设计采用定制机架,可装入标准天鹅座货运舱,配备被动散热器以及商用AMD MI250 GPU和抗辐射FPGA的混合方案。他们声称目标推理成本为每百万tokens 0.50美元——与GPT-4o定价相当——但尚未展示超过30天的持续运行。其GitHub仓库(lumen-orbit/space-compute)拥有2,300颗星,包含轨道热动力学仿真代码。

Axiom Space(德克萨斯州休斯顿)正在为国际空间站建造商业模块,将托管供NASA和国防部客户使用的AI计算架。他们的方法不那么激进——使用带有重型屏蔽的地面硬件,并依赖机组人员维护——但这是目前唯一运营中的太空计算服务。定价未公开,但分析师估计每小时计算时间费用在10,000至50,000美元之间。

Cosmic Shielding Corporation(加利福尼亚州帕洛阿尔托)不发射服务器,但销售抗辐射存储器和逻辑IP。其专利技术“纠错码(ECC)2.0”声称可在不产生三模冗余性能损失的情况下,将SEU率降低99%。他们有一个GitHub仓库(cosmic-shielding/ecc2),拥有850颗星,并提供Verilog参考实现。

数据表:存

时间归档

May 20261234 篇已发布文章

延伸阅读

太空计算进入建设阶段:抗辐射芯片与轨道数据中心重构AI基础设施围绕轨道计算的投机热潮已冷却,取而代之的是静默而密集的产业建设。在聚光灯之外,一条从专用芯片到在轨维护的完整供应链正在成形,将科幻概念锻造成未来实时AI与全球数据服务的战略支柱。马斯克弃地面AI模型,豪赌轨道计算未来埃隆·马斯克正执行一项激进的战略转向:放弃地面大模型竞赛,全力押注太空计算。通过部署轨道数据中心和卫星GPU集群,他旨在绕过地球上的能源与土地限制,有望从轨道上重新定义实时AI推理的延迟与可扩展性。冲向太空的AI:马斯克25万亿美元的轨道数据中心豪赌埃隆·马斯克解散了xAI,并将GPU租给竞争对手。AINews深入调查这一战略:从地面AI基础设施到价值25万亿美元的轨道计算网络的精心转向,利用太阳能和激光链路重新定义AI的经济学。资本、算力与信任:定义AI新阶段的三位一体本周,AI行业迎来战略重组:微软对OpenAI的130亿美元投资瞄准920亿美元回报,英伟达部署400亿美元股权锁定硬件生态,OpenAI斥资40亿美元成立部署公司并收购Tomoro,而谷歌与苹果携手为RCS消息实现端到端加密。这些动作共同

常见问题

这次公司发布“Space-Borne Servers: The Next Frontier for AI Compute or a Billion-Dollar Mirage?”主要讲了什么?

The idea of moving data centers into orbit is no longer science fiction. Companies like Lumen Orbit, Axiom Space, and a handful of stealth startups have begun launching prototype c…

从“space-based AI inference cost comparison”看,这家公司的这次发布为什么值得关注?

The core challenge of space compute is not getting hardware to orbit—it is keeping it alive and productive once there. Radiation Hardening vs. Software Mitigation Standard AI accelerators (NVIDIA H100/B200, AMD MI300X) a…

围绕“radiation hardened GPU vs commercial GPU SEU rates”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。