AI模型过期比牛奶还快:定价崩盘如何重塑行业格局

April 2026
归档:April 2026
前沿大语言模型的市场价值正以前所未有的速度崩塌,部分模型发布数月内价格跌幅超过90%。AINews深度解析开源模型、云厂商补贴与高度同质化如何将产品的“保质期”从12个月压缩至3个月以下,威胁整个AI商业模式的根基。

大语言模型的定价已进入自由落体状态。AINews数据显示,前沿模型的平均“保质期”——即能维持溢价定价的周期——已从2023年的约12个月骤降至2026年的不足3个月。这并非暂时的市场修正,而是由三股力量汇聚而成的结构性转变。首先,Meta的Llama系列与Mistral AI等开源模型侵蚀了专有模型的护城河,以零推理成本提供可比性能。其次,亚马逊云服务、微软Azure与谷歌云等主流云厂商正大力补贴推理成本,常以低于成本的价格出售API访问权限,以将客户锁定在其更广泛的生态系统中。第三,市场充斥着数百个性能趋同的模型,差异化几乎消失。这种“商品化”螺旋意味着,即便是最先进的AI模型也正迅速沦为低利润、高周转的商品,迫使整个行业重新思考如何创造和捕获价值。

技术深度解析

定价崩盘本质上是一个技术商品化的故事。现代LLM的核心架构——Transformer——已成为标准化的构建模块。尽管GPT-4和Claude 3.5曾被视为专有奇迹,但其底层技术如今已在开源仓库中被广泛复制。

开源基准追赶

最重要的技术驱动力是开源模型在专有基准上的快速收敛。以Llama家族的演进为例:Llama 2(2023年7月)在MMLU上落后GPT-4约15个百分点;Llama 3(2024年4月)将差距缩小至5个百分点以内;Llama 4(预计2025年)预计将在多项关键指标上匹配或超越GPT-4o。这一轨迹并非偶然——它反映了开源社区复制并改进已发表技术(如基于人类反馈的强化学习RLHF、混合专家模型MoE与高级量化)的能力。

量化革命

第二个技术因素是通过量化大幅降低推理成本。GPTQ、AWQ与GGUF等技术使模型能在消费级硬件上运行,且精度损失极小。2023年需要A100 GPU的模型,到2025年可在MacBook Air上运行。这已将单次查询成本从美分降至美分的零头,使提供商提供免费层级或近乎零定价在经济上成为可能。

MoE效率飞跃

由Mixtral 8x7B推广、后被GPT-4和Gemini采用的混合专家架构进一步压缩了成本。通过每个token仅激活部分参数,MoE模型以更低计算量实现高性能。这意味着提供商能用相同硬件服务更多用户,从而降低单次查询成本,并实施激进定价策略。

| 模型 | 发布日期 | MMLU得分(5-shot) | 每百万token输入价格 | 较峰值价格跌幅 |
|---|---|---|---|---|
| GPT-4 | 2023年3月 | 86.4 | $30.00 | — |
| GPT-4o | 2024年5月 | 88.7 | $5.00 | -83% |
| GPT-4o-mini | 2024年7月 | 82.0 | $0.15 | -99.5% |
| Claude 3 Opus | 2024年3月 | 86.8 | $15.00 | — |
| Claude 3.5 Sonnet | 2024年6月 | 88.3 | $3.00 | -80% |
| Llama 3 70B(开源) | 2024年4月 | 82.0 | $0.00(自托管) | -100% |
| Mistral Large 2 | 2024年7月 | 84.0 | $2.00 | -87% |

数据要点: 表格清晰显示了一个模式:GPT-4发布后的12-16个月内,可比性能的价格暴跌超过80%,而开源选项提供零边际成本。专有模型的“溢价”已蒸发殆尽。

关键玩家与案例分析

价格战在主要玩家中创造了截然不同的赢家与输家。

OpenAI:价格屠夫

OpenAI在降价方面最为激进,将GPT-4o的成本削减83%,并推出GPT-4o-mini,价格较原始GPT-4折扣99.5%。这一策略是防御性的:通过让自家模型变得廉价,他们希望留住可能转向开源或更便宜替代品的客户。然而,这蚕食了自身收入,并引发疑问:他们将如何收回训练GPT-5等未来模型预计花费的50-100亿美元?

Meta:颠覆者

Meta的策略最为激进:免费赠送皇冠明珠。通过以开放权重形式发布Llama 3和4,Meta实际上摧毁了专有模型的定价权。该公司的赌注是:将模型层商品化将推动对其硬件(通过定制芯片)和社交平台(AI功能成为独家卖点)的需求。这是一项长期布局,以牺牲短期AI收入换取生态系统主导地位。

Mistral AI:欧洲挑战者

Mistral采取了混合模式:发布小型高效的开源模型(Mistral 7B、Mixtral 8x7B),同时为大型模型提供溢价API。其定价始终比OpenAI低50-70%,迫使整个市场下行。其成功表明,即便资金充裕的初创公司也无法在当前环境中维持溢价定价。

云厂商:补贴者

亚马逊、微软和谷歌将AI作为亏损引流工具。它们以成本价或低于成本价提供模型,通过计算、存储和数据服务弥补差额。例如,AWS Bedrock上Claude 3.5 Sonnet的定价通常比Anthropic的直接API定价低20-30%。这创造了一种反常激励:模型越成功,云厂商在推理上亏损越多,但它们在平台锁定上获益也越多。

| 公司 | 策略 | 模型定价趋势 | 主要收入来源 | 脆弱性 |
|---|---|---|---|---|
| OpenAI | 从溢价到商品化 | 18个月内下跌90% | API订阅 | 无护城河,高研发成本 |
| Meta | 开源免费赠送 | $0(自托管) | 广告、硬件 | 无直接AI收入 |
| Anthropic | 溢价利基市场 | 12个月内下跌80% | API、企业合作 | 亏损

时间归档

April 20263042 篇已发布文章

延伸阅读

小米AI模型降价99%:一场以生态为名的“特洛伊木马”攻势小米宣布将大语言模型API价格永久下调99%,此举被普遍视为对DeepSeek的直接挑战。但这绝非简单的价格战——而是一场精心布局的战略:将AI编织进其庞大的硬件生态,从手机到汽车,构建一个竞争对手难以打破的闭环粘性系统。DeepSeek永久降价引爆AI基础设施大战:深度全解析DeepSeek宣布对其大语言模型实施永久性降价,标志着AI竞争从技术优先正式转向规模优先。这一举措,连同中国针对3亿多未登记城镇常住人口的新社会政策以及神舟二十三号的成功发射,共同昭示着AI正在转型为底层基础设施。DeepSeek V4的反平台策略:通过让自己变得“多余”来重写AI经济学DeepSeek V4将缓存命中推理价格永久性降低90%,与OpenAI的成本差距拉大至34.5倍。这并非价格战,而是一场精心策划的“反平台”战略:让模型变得极其廉价且无处不在,以至于没有任何开发者会依赖单一供应商。AI版图正在被重新绘制。AI Model Shelf Life Collapses: Why Leadership Is Now a Temporary StateThe era of a single AI model dominating for half a year is over. AINews data shows the interval between a new 'best' mod

常见问题

这次模型发布“AI Models Expire Faster Than Milk: The Pricing Collapse Reshaping the Industry”的核心内容是什么?

The pricing of large language models has entered a state of freefall. AINews data reveals that the average 'shelf life' of a frontier model—the period during which it can command p…

从“Why are AI model prices dropping so fast?”看,这个模型发布为什么重要?

The pricing collapse is fundamentally a story of technical commoditization. The core architecture of modern LLMs—the Transformer—has become a standardized building block. While GPT-4 and Claude 3.5 were once considered p…

围绕“Is it still worth investing in AI startups?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。