OpenAI 亏损 340 亿美元:AI 军备竞赛的财务悬崖

Hacker News June 2026
来源:Hacker News归档:June 2026
OpenAI 在 2025 年的亏损飙升至 340 亿美元,同比增长 8 倍。这不仅是财务警报,更是对 AI 行业商业模式的根本性质疑——训练、推理和基础设施的指数级成本正在吞噬一切。

OpenAI 2025 年财报显示,其净亏损高达 340 亿美元,较上年增长近 8 倍。这笔巨额赤字并非管理失误,而是前沿 AI 军备竞赛中残酷经济学的直接后果。成本飙升的两大核心驱动力是:训练 GPT-5 等模型以及探索视频生成与世界模型所需的指数级增长的计算资源;以及运行实时推理(尤其是智能体系统)所产生的大量、且常被低估的成本。尽管 OpenAI 的收入因 API 订阅、企业合作和 ChatGPT Plus 而显著增长,但完全被膨胀的基础设施和算力账单所超越。这形成了一个深刻的“烧钱悖论”:模型能力越强,运行成本越高,直接侵蚀利润空间。

技术深度解析

340 亿美元的亏损根植于两个截然不同但又相互交织的技术成本中心:训练推理

训练成本: 从 GPT-4 到 GPT-5(及更远)的跃迁代表着计算需求的阶跃式增长。训练一个前沿模型现在需要由 10 万+ GPU 组成的集群运行数月。从密集 Transformer 架构向混合专家(MoE)模型的转变,虽然提高了推理效率,但并未降低训练成本。事实上,MoE 模型需要更多总参数和更复杂的路由逻辑,从而增加了训练计算预算。此外,对视频生成模型(如 Sora)和世界模型的探索增加了一个全新的成本维度。这些模型处理高维时空数据,所需计算量比纯文本模型高出数个数量级。仅一次 Sora 训练运行,在云算力上的预估成本就高达数千万美元。

推理成本:隐藏的猛兽: 最令人担忧的成本驱动因素是推理。行业已从简单的聊天补全转向复杂的多步骤智能体工作流。一个能够浏览网页、编写代码、运行并迭代结果的 AI 智能体,其 token 消耗量可能是简单问答的 10 到 100 倍。实时功能(如语音模式和实时视频分析)进一步放大了这一效应。GPT-5 级别智能体的单次查询成本不再是几美分,而可能是数美元。这产生了一种反常激励:AI 越有用、越自主,其运行成本就越高,直接侵蚀利润。

| 成本类别 | GPT-4 时代 (2023) | GPT-5 时代 (2025) | 倍数 |
|---|---|---|---|
| 训练计算量 (FLOPs) | 2e25 | 1e27 (预估) | 50x |
| 训练成本 (预估) | 1 亿美元 | 20 亿美元+ | 20x |
| 复杂查询推理成本 | 0.01 - 0.05 美元 | 0.50 - 5.00 美元 | 50-100x |
| 年度总计算预算 | 10 亿美元 | 150 亿美元+ | 15x |

数据要点: 训练和推理成本在关键指标上均爆炸式增长了 15-100 倍。每次查询的推理成本是最危险的变量,因为它直接随用户参与度和智能体复杂性而扩展,形成了一种与传统软件截然不同的成本结构。

相关开源项目: 开源社区正在积极尝试解决这一问题。vLLM 仓库(现已有超过 4 万颗星)专注于使用 PagedAttention 实现高吞吐量、低延迟推理,可减少内存浪费。llama.cpp(超过 7 万颗星)能够在消费级硬件上实现高效推理,但无法匹敌数据中心集群的吞吐量。微软的 DeepSpeed(超过 3.5 万颗星)提供了 ZeRO 优化和混合专家训练,但即使这些优化也无法完全抵消问题的规模。

关键玩家与案例研究

OpenAI 并非唯一面临财务压力的公司。整个前沿领域都在应对同样的动态。

Google DeepMind: 凭借其 Gemini 模型,Google 拥有自有 TPU 硬件的优势,并拥有庞大的盈利广告业务来补贴 AI 亏损。然而,其 AI 基础设施的资本支出预计在 2025 年将超过 500 亿美元。Google 正押注于垂直整合(TPU + 软件)以创造成本优势,但其投资规模本身就是一个风险。

Anthropic: Claude 系列模型,尤其是 Claude 3.5 Opus,是直接竞争对手。Anthropic 已筹集超过 100 亿美元,但烧钱速度可能与 OpenAI 相似,尽管规模较小。他们对安全性和可解释性(通过其“机制可解释性”研究)的关注是一项长期赌注,短期内可能不会产生财务回报。

Meta (FAIR): Meta 采取了截然不同的策略,将其 Llama 模型开源。这大幅降低了其自身的推理成本(社区运行模型),但也放弃了直接通过技术变现的能力。Meta 的策略是将模型层商品化,以围绕其平台(WhatsApp、Instagram)构建生态系统。

| 公司 | 2025 年预估 AI 支出 | 主要模型 | 策略 | AI 收入 (预估) |
|---|---|---|---|---|
| OpenAI | 400 亿美元+ | GPT-5 | 专有,API 优先 | 50-70 亿美元 |
| Google DeepMind | 500 亿美元+ | Gemini 2.0 | 专有,集成 | 100-150 亿美元 (通过云) |
| Anthropic | 80 亿美元+ | Claude 3.5 | 专有,安全优先 | 10-20 亿美元 |
| Meta | 100 亿美元+ | Llama 4 | 开源,生态系统玩法 | 0 美元 (间接) |

数据要点: OpenAI 在顶级玩家中拥有最差的收入与支出比。虽然 Google 可以吸收亏损,Meta 有不同的战略目标,但 OpenAI 处于一个危险的境地:其成本增长速度超过了核心产品创收能力。

行业影响与市场动态

340 亿美元的亏损正在重塑整个 AI 市场。首要影响是资本集中。只有少数公司——那些能够获得近乎无限资本的公司——才能继续参与这场游戏。

更多来自 Hacker News

Noema64国际象棋引擎:大模型推理能否以智取胜,挑战Stockfish的暴力计算?AINews独家获悉了Noema64——一款开源国际象棋引擎,它代表着人工智能在博弈领域的一次范式转变。与Stockfish等通过穷举搜索树每秒评估数百万个位置的传统引擎不同,Noema64利用大语言模型(LLM)以类人方式对棋局进行推理。Spaturzu SDKs:开源利器,终于让AI Agent的API成本无所遁形多Agent AI架构的快速普及引发了一场隐性危机:当数十个Agent共享一个API密钥时,财务团队根本无法判断哪个Agent在烧钱。新发布的开源项目Spaturzu SDKs直接瞄准了这一盲区。该工具的工作原理是,在每次向OpenAI和AToken清算时刻:CFO们要求每一笔API调用都要有ROI过去两年,企业一直把大语言模型当作一个“消防水带”:把所有问题都抛给GPT-4,付账单,然后宣布胜利。那个时代正在终结。一门新的学科——Token经济学——正在迫使企业核算每一次推理的成本。我们的调查显示,许多公司现在将超过20%的总IT预查看来源专题页Hacker News 已收录 4818 篇文章

时间归档

June 20261654 篇已发布文章

延伸阅读

OpenAI为何关闭Sora独立应用:AI演示文化的终结OpenAI已悄然停止其独立的Sora视频生成应用,将重心转向API与平台集成。这一战略收缩揭示了当今AI领域中研究突破与可持续产品化之间的根本性张力。此举标志着孤立‘炫技式’演示的终结,以及集成化多模态实用时代的开端。OpenAI年亏385亿美元:AGI军备竞赛背后的残酷经济学一份泄露的内部财务数据显示,OpenAI每年烧掉385亿美元,仅算力成本就吞噬了超过60%的收入。这一前所未有的烧钱速度,揭示了AGI竞赛中残酷的经济逻辑:每一代模型都需要指数级增长的算力资源,迫使公司押注推理效率突破,以化解资金链危机。AI的终极噩梦:西雅图魔幻环岛,如何撕开自动驾驶的致命短板西雅图那个臭名昭著的“魔幻环岛”,正无情地暴露出现有AI驾驶系统的根本性缺陷。AINews深度分析指出,这个多车道、无信号灯的交叉路口,迫使AI直面人类驾驶员模糊的逻辑与涌现行为,要求其从“遵守规则”向“理解意图”进行范式转变。GateGPT 用 80MHz FPGA 跑出 56K Tokens/s:边缘 AI 推理正在重写硬件等级制度GateGPT 在仅 80MHz 的 FPGA 上实现了每秒 56,000 个 token 的 Transformer 推理,彻底颠覆了“高主频与大规模并行计算是部署大模型前提”的传统认知。这一突破的核心在于一种全新的 KV 缓存设计,它消

常见问题

这次公司发布“OpenAI's $34 Billion Loss: The Financial Cliff of the AI Arms Race”主要讲了什么?

OpenAI's financial results for 2025 reveal a staggering $34 billion net loss, a nearly 8x increase from the previous year. This explosive growth in red ink is not a sign of mismana…

从“OpenAI financial sustainability 2025”看,这家公司的这次发布为什么值得关注?

The $34 billion loss is rooted in two distinct but intertwined technical cost centers: training and inference. Training Costs: The move from GPT-4 to GPT-5 (and beyond) represents a step-function increase in compute requ…

围绕“AI inference cost crisis”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。