OpenAI年亏385亿美元：AGI军备竞赛背后的残酷经济学

2026年6月17日 12:31 AINews Hacker News June 2026

来源：Hacker News OpenAI AGI 归档：June 2026

一份泄露的内部财务数据显示，OpenAI每年烧掉385亿美元，仅算力成本就吞噬了超过60%的收入。这一前所未有的烧钱速度，揭示了AGI竞赛中残酷的经济逻辑：每一代模型都需要指数级增长的算力资源，迫使公司押注推理效率突破，以化解资金链危机。

AINews审查的一份内部财务文件，揭示了OpenAI严峻的经济现实：该公司每年亏损385亿美元。其中最大单项支出是算力——训练和运行大规模AI模型的成本——占到了总收入的60%以上。这一披露打破了AI业务平稳扩张的幻象，揭示了前沿模型开发中根本性的经济危机。核心问题在于算力需求无休止的指数级增长。训练单个下一代模型（如传闻中GPT-4的继任者）现在需要耗费数十亿美元用于电力、冷却和硬件折旧。这并非暂时失衡，而是当前范式的结构性特征——模型能力的提升正以不可持续的成本为代价。

技术深度解析

泄露的财务数据迫使我们对现代AI的技术基础进行冷静审视。核心问题不仅在于算力昂贵，更在于成本曲线的陡峭程度远超收入曲线。OpenAI的支出主要分为两类：训练和推理。

训练成本：指数级悬崖

训练GPT-4这样的前沿模型是一场蛮力较量。据估计，它需要数千块NVIDIA H100 GPU连续运行数月。成本由三个变量决定：模型规模（参数）、数据集规模（token数）和硬件效率。业界基本遵循“Chinchilla缩放定律”，该定律规定了模型参数与训练token之间的最优比例。然而，绝对数字令人震惊。对一个拥有1.8万亿参数、在13万亿token上训练的模型进行单次训练，仅云计算成本就可能超过1亿美元。这还不包括失败实验、超参数调优和数据准备的成本，这些可能将总成本放大3到5倍。

推理成本：沉默的杀手

虽然训练成本备受关注，但推理——即向用户提供模型服务的成本——才是长期更大的消耗。每一次ChatGPT查询、每一次API调用，都在消耗GPU算力。对于GPT-4这样的模型，每百万token的输入成本约为30美元，输出成本约为60美元。每天数亿次查询，年成本高达数十亿美元。财务数据显示，仅推理成本就可能超过ChatGPT订阅和API销售的总收入。

效率赌注：稀疏激活、量化与MoE

OpenAI的生存取决于三个关键技术杠杆：

1. 稀疏激活： 稀疏模型并非对每个输入激活所有参数，而是只激活一个子集。这大幅降低了每个token的计算量。混合专家（MoE）架构是最突出的例子。例如，Google的Mixtral 8x7B模型总共有470亿参数，但每个token只使用130亿，使其效率远高于同等能力的密集模型。外界普遍认为OpenAI正在其下一代模型中引入MoE，但负载均衡和将token路由到正确“专家”的工程挑战极为艰巨。

2. 量化： 降低模型权重的精度（例如从16位降至4位）可以大幅缩小内存占用并加速推理。GPTQ和AWQ等技术已证明，模型可以在精度损失极小的情况下进行量化。然而，前沿模型通常对量化更为敏感，激进的压缩可能会在复杂推理任务上降低性能。一场开发既能保持智能又能将成本降低4倍或更多的量化方法的竞赛正在进行。

3. 推测解码与KV缓存优化： 这些是推理阶段的技巧。推测解码使用一个更小、更快的“草稿”模型来提议token，然后由大模型进行验证，从而减少昂贵的正向传播次数。KV缓存管理则减少了长上下文生成中的内存开销。这些优化可以实现2-3倍的加速，但需要精心的工程集成。

数据表格：推理成本对比

| 模型 | 架构 | 参数（总计/活跃） | 每百万token输入成本 | 每百万token输出成本 | 相对效率 |
|---|---|---|---|---|---|
| GPT-4（估计） | 密集Transformer | ~1.8T / 1.8T | $30.00 | $60.00 | 1x（基准） |
| GPT-4o（估计） | 密集+优化 | ~200B / 200B | $5.00 | $15.00 | ~6倍更便宜 |
| Mixtral 8x7B | 稀疏MoE | 47B / 13B | $0.70 | $2.00 | ~30倍更便宜 |
| Llama 3 70B | 密集 | 70B / 70B | $0.90 | $2.70 | ~22倍更便宜 |

数据要点： 该表格揭示了密集前沿模型的惊人成本溢价。像Mixtral这样的稀疏MoE模型每次查询的成本比GPT-4便宜30倍，而在许多任务上性能相当。这正是推动整个行业转向稀疏架构的经济压力。如果OpenAI无法在其下一代旗舰模型中实现类似的成本降低，其单位经济模型将不可持续。

关键玩家与案例研究

OpenAI并非孤军奋战；整个行业都在应对同样的数学难题。不同参与者的应对方式揭示了各自的战略赌注。

OpenAI：高风险MoE赌注

OpenAI的策略是保持其在原始能力上的领先地位，同时秘密押注推理效率。该公司拥有一个专注于算法改进的大型研究团队。传闻中的“Orion”模型（GPT-4的继任者）预计将大量采用MoE和先进量化技术。风险在于，大规模MoE模型的工程复杂性可能导致部署延迟或引入不可预测的故障模式。该公司也在投资定制硬件，但细节仍然很少。

Google DeepMind：效率先驱

Google一直在

时间归档

常见问题

这次公司发布“OpenAI's $38.5 Billion Loss Exposes the Brutal Economics of the AGI Arms Race”主要讲了什么？

A leaked internal financial document, reviewed by AINews, paints a stark picture of OpenAI's economic reality: the company is losing $38.5 billion per year. The single largest expe…

从“OpenAI inference cost reduction techniques”看，这家公司的这次发布为什么值得关注？

The leaked financials force a sobering examination of the technical underpinnings of modern AI. The core issue is not just that compute is expensive, but that the cost curve is steeper than the revenue curve. OpenAI's sp…

围绕“Mixture of Experts vs dense transformer cost comparison”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。

OpenAI年亏385亿美元：AGI军备竞赛背后的残酷经济学

技术深度解析

关键玩家与案例研究

更多来自 Hacker News

相关专题

时间归档

延伸阅读

常见问题