OpenAI年亏385亿美元:AGI军备竞赛背后的残酷经济学

Hacker News June 2026
来源:Hacker NewsOpenAIAGI归档:June 2026
一份泄露的内部财务数据显示,OpenAI每年烧掉385亿美元,仅算力成本就吞噬了超过60%的收入。这一前所未有的烧钱速度,揭示了AGI竞赛中残酷的经济逻辑:每一代模型都需要指数级增长的算力资源,迫使公司押注推理效率突破,以化解资金链危机。

AINews审查的一份内部财务文件,揭示了OpenAI严峻的经济现实:该公司每年亏损385亿美元。其中最大单项支出是算力——训练和运行大规模AI模型的成本——占到了总收入的60%以上。这一披露打破了AI业务平稳扩张的幻象,揭示了前沿模型开发中根本性的经济危机。核心问题在于算力需求无休止的指数级增长。训练单个下一代模型(如传闻中GPT-4的继任者)现在需要耗费数十亿美元用于电力、冷却和硬件折旧。这并非暂时失衡,而是当前范式的结构性特征——模型能力的提升正以不可持续的成本为代价。

技术深度解析

泄露的财务数据迫使我们对现代AI的技术基础进行冷静审视。核心问题不仅在于算力昂贵,更在于成本曲线的陡峭程度远超收入曲线。OpenAI的支出主要分为两类:训练和推理。

训练成本:指数级悬崖

训练GPT-4这样的前沿模型是一场蛮力较量。据估计,它需要数千块NVIDIA H100 GPU连续运行数月。成本由三个变量决定:模型规模(参数)、数据集规模(token数)和硬件效率。业界基本遵循“Chinchilla缩放定律”,该定律规定了模型参数与训练token之间的最优比例。然而,绝对数字令人震惊。对一个拥有1.8万亿参数、在13万亿token上训练的模型进行单次训练,仅云计算成本就可能超过1亿美元。这还不包括失败实验、超参数调优和数据准备的成本,这些可能将总成本放大3到5倍。

推理成本:沉默的杀手

虽然训练成本备受关注,但推理——即向用户提供模型服务的成本——才是长期更大的消耗。每一次ChatGPT查询、每一次API调用,都在消耗GPU算力。对于GPT-4这样的模型,每百万token的输入成本约为30美元,输出成本约为60美元。每天数亿次查询,年成本高达数十亿美元。财务数据显示,仅推理成本就可能超过ChatGPT订阅和API销售的总收入。

效率赌注:稀疏激活、量化与MoE

OpenAI的生存取决于三个关键技术杠杆:

1. 稀疏激活: 稀疏模型并非对每个输入激活所有参数,而是只激活一个子集。这大幅降低了每个token的计算量。混合专家(MoE)架构是最突出的例子。例如,Google的Mixtral 8x7B模型总共有470亿参数,但每个token只使用130亿,使其效率远高于同等能力的密集模型。外界普遍认为OpenAI正在其下一代模型中引入MoE,但负载均衡和将token路由到正确“专家”的工程挑战极为艰巨。

2. 量化: 降低模型权重的精度(例如从16位降至4位)可以大幅缩小内存占用并加速推理。GPTQ和AWQ等技术已证明,模型可以在精度损失极小的情况下进行量化。然而,前沿模型通常对量化更为敏感,激进的压缩可能会在复杂推理任务上降低性能。一场开发既能保持智能又能将成本降低4倍或更多的量化方法的竞赛正在进行。

3. 推测解码与KV缓存优化: 这些是推理阶段的技巧。推测解码使用一个更小、更快的“草稿”模型来提议token,然后由大模型进行验证,从而减少昂贵的正向传播次数。KV缓存管理则减少了长上下文生成中的内存开销。这些优化可以实现2-3倍的加速,但需要精心的工程集成。

数据表格:推理成本对比

| 模型 | 架构 | 参数(总计/活跃) | 每百万token输入成本 | 每百万token输出成本 | 相对效率 |
|---|---|---|---|---|---|
| GPT-4(估计) | 密集Transformer | ~1.8T / 1.8T | $30.00 | $60.00 | 1x(基准) |
| GPT-4o(估计) | 密集+优化 | ~200B / 200B | $5.00 | $15.00 | ~6倍更便宜 |
| Mixtral 8x7B | 稀疏MoE | 47B / 13B | $0.70 | $2.00 | ~30倍更便宜 |
| Llama 3 70B | 密集 | 70B / 70B | $0.90 | $2.70 | ~22倍更便宜 |

数据要点: 该表格揭示了密集前沿模型的惊人成本溢价。像Mixtral这样的稀疏MoE模型每次查询的成本比GPT-4便宜30倍,而在许多任务上性能相当。这正是推动整个行业转向稀疏架构的经济压力。如果OpenAI无法在其下一代旗舰模型中实现类似的成本降低,其单位经济模型将不可持续。

关键玩家与案例研究

OpenAI并非孤军奋战;整个行业都在应对同样的数学难题。不同参与者的应对方式揭示了各自的战略赌注。

OpenAI:高风险MoE赌注

OpenAI的策略是保持其在原始能力上的领先地位,同时秘密押注推理效率。该公司拥有一个专注于算法改进的大型研究团队。传闻中的“Orion”模型(GPT-4的继任者)预计将大量采用MoE和先进量化技术。风险在于,大规模MoE模型的工程复杂性可能导致部署延迟或引入不可预测的故障模式。该公司也在投资定制硬件,但细节仍然很少。

Google DeepMind:效率先驱

Google一直在

更多来自 Hacker News

Noema64国际象棋引擎:大模型推理能否以智取胜,挑战Stockfish的暴力计算?AINews独家获悉了Noema64——一款开源国际象棋引擎,它代表着人工智能在博弈领域的一次范式转变。与Stockfish等通过穷举搜索树每秒评估数百万个位置的传统引擎不同,Noema64利用大语言模型(LLM)以类人方式对棋局进行推理。Spaturzu SDKs:开源利器,终于让AI Agent的API成本无所遁形多Agent AI架构的快速普及引发了一场隐性危机:当数十个Agent共享一个API密钥时,财务团队根本无法判断哪个Agent在烧钱。新发布的开源项目Spaturzu SDKs直接瞄准了这一盲区。该工具的工作原理是,在每次向OpenAI和AToken清算时刻:CFO们要求每一笔API调用都要有ROI过去两年,企业一直把大语言模型当作一个“消防水带”:把所有问题都抛给GPT-4,付账单,然后宣布胜利。那个时代正在终结。一门新的学科——Token经济学——正在迫使企业核算每一次推理的成本。我们的调查显示,许多公司现在将超过20%的总IT预查看来源专题页Hacker News 已收录 4818 篇文章

相关专题

OpenAI152 篇相关文章AGI29 篇相关文章

时间归档

June 20261654 篇已发布文章

延伸阅读

百亿悖论:AI巨头每赚1美元,为何倒贴10美元?用户每支付100美元AI服务费,背后的实际成本却超过1000美元。这10倍的亏损比率并非运营失误,而是AI实验室精心策划的未来赌局。但当资本水龙头拧紧时,这场豪赌将如何收场?GPT-5.5「思维路由器」降本25%,开启真正AI智能体时代OpenAI悄然发布GPT-5.5,其核心创新——轻量级「思维路由器」模块——可根据查询复杂度动态分配算力,在多步推理基准测试中实现40%的性能飞跃,同时将标准推理成本降低约25%。这一架构转向标志着高效、具备智能体能力的模型新时代的到来。OpenAI对决英伟达:四千亿美元豪赌,谁能主宰AI推理王座?人工智能产业正见证一场史无前例的资本军备竞赛。OpenAI与英伟达据称各自调动约2000亿美元,这场总额近4000亿美元的豪赌,标志着行业战略重心已从单纯堆叠算力规模,转向攻克AI推理的核心堡垒——即让机器学会思考、规划与理解因果。OpenAI收购Ona:Codex从代码助手进化为自主项目经理OpenAI收购了专注于自主代码修复与长周期任务规划的隐形初创公司Ona。这绝非一次简单的功能补丁——而是一次战略跃迁,旨在将Codex从代码编写副驾驶转变为能够管理整个软件项目的自主开发智能体。

常见问题

这次公司发布“OpenAI's $38.5 Billion Loss Exposes the Brutal Economics of the AGI Arms Race”主要讲了什么?

A leaked internal financial document, reviewed by AINews, paints a stark picture of OpenAI's economic reality: the company is losing $38.5 billion per year. The single largest expe…

从“OpenAI inference cost reduction techniques”看,这家公司的这次发布为什么值得关注?

The leaked financials force a sobering examination of the technical underpinnings of modern AI. The core issue is not just that compute is expensive, but that the cost curve is steeper than the revenue curve. OpenAI's sp…

围绕“Mixture of Experts vs dense transformer cost comparison”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。