AI模型过期比牛奶还快:定价崩盘如何重塑行业格局

April 2026
归档:April 2026
前沿大语言模型的市场价值正以前所未有的速度崩塌,部分模型发布数月内价格跌幅超过90%。AINews深度解析开源模型、云厂商补贴与高度同质化如何将产品的“保质期”从12个月压缩至3个月以下,威胁整个AI商业模式的根基。

大语言模型的定价已进入自由落体状态。AINews数据显示,前沿模型的平均“保质期”——即能维持溢价定价的周期——已从2023年的约12个月骤降至2026年的不足3个月。这并非暂时的市场修正,而是由三股力量汇聚而成的结构性转变。首先,Meta的Llama系列与Mistral AI等开源模型侵蚀了专有模型的护城河,以零推理成本提供可比性能。其次,亚马逊云服务、微软Azure与谷歌云等主流云厂商正大力补贴推理成本,常以低于成本的价格出售API访问权限,以将客户锁定在其更广泛的生态系统中。第三,市场充斥着数百个性能趋同的模型,差异化几乎消失。这种“商品化”螺旋意味着,即便是最先进的AI模型也正迅速沦为低利润、高周转的商品,迫使整个行业重新思考如何创造和捕获价值。

技术深度解析

定价崩盘本质上是一个技术商品化的故事。现代LLM的核心架构——Transformer——已成为标准化的构建模块。尽管GPT-4和Claude 3.5曾被视为专有奇迹,但其底层技术如今已在开源仓库中被广泛复制。

开源基准追赶

最重要的技术驱动力是开源模型在专有基准上的快速收敛。以Llama家族的演进为例:Llama 2(2023年7月)在MMLU上落后GPT-4约15个百分点;Llama 3(2024年4月)将差距缩小至5个百分点以内;Llama 4(预计2025年)预计将在多项关键指标上匹配或超越GPT-4o。这一轨迹并非偶然——它反映了开源社区复制并改进已发表技术(如基于人类反馈的强化学习RLHF、混合专家模型MoE与高级量化)的能力。

量化革命

第二个技术因素是通过量化大幅降低推理成本。GPTQ、AWQ与GGUF等技术使模型能在消费级硬件上运行,且精度损失极小。2023年需要A100 GPU的模型,到2025年可在MacBook Air上运行。这已将单次查询成本从美分降至美分的零头,使提供商提供免费层级或近乎零定价在经济上成为可能。

MoE效率飞跃

由Mixtral 8x7B推广、后被GPT-4和Gemini采用的混合专家架构进一步压缩了成本。通过每个token仅激活部分参数,MoE模型以更低计算量实现高性能。这意味着提供商能用相同硬件服务更多用户,从而降低单次查询成本,并实施激进定价策略。

| 模型 | 发布日期 | MMLU得分(5-shot) | 每百万token输入价格 | 较峰值价格跌幅 |
|---|---|---|---|---|
| GPT-4 | 2023年3月 | 86.4 | $30.00 | — |
| GPT-4o | 2024年5月 | 88.7 | $5.00 | -83% |
| GPT-4o-mini | 2024年7月 | 82.0 | $0.15 | -99.5% |
| Claude 3 Opus | 2024年3月 | 86.8 | $15.00 | — |
| Claude 3.5 Sonnet | 2024年6月 | 88.3 | $3.00 | -80% |
| Llama 3 70B(开源) | 2024年4月 | 82.0 | $0.00(自托管) | -100% |
| Mistral Large 2 | 2024年7月 | 84.0 | $2.00 | -87% |

数据要点: 表格清晰显示了一个模式:GPT-4发布后的12-16个月内,可比性能的价格暴跌超过80%,而开源选项提供零边际成本。专有模型的“溢价”已蒸发殆尽。

关键玩家与案例分析

价格战在主要玩家中创造了截然不同的赢家与输家。

OpenAI:价格屠夫

OpenAI在降价方面最为激进,将GPT-4o的成本削减83%,并推出GPT-4o-mini,价格较原始GPT-4折扣99.5%。这一策略是防御性的:通过让自家模型变得廉价,他们希望留住可能转向开源或更便宜替代品的客户。然而,这蚕食了自身收入,并引发疑问:他们将如何收回训练GPT-5等未来模型预计花费的50-100亿美元?

Meta:颠覆者

Meta的策略最为激进:免费赠送皇冠明珠。通过以开放权重形式发布Llama 3和4,Meta实际上摧毁了专有模型的定价权。该公司的赌注是:将模型层商品化将推动对其硬件(通过定制芯片)和社交平台(AI功能成为独家卖点)的需求。这是一项长期布局,以牺牲短期AI收入换取生态系统主导地位。

Mistral AI:欧洲挑战者

Mistral采取了混合模式:发布小型高效的开源模型(Mistral 7B、Mixtral 8x7B),同时为大型模型提供溢价API。其定价始终比OpenAI低50-70%,迫使整个市场下行。其成功表明,即便资金充裕的初创公司也无法在当前环境中维持溢价定价。

云厂商:补贴者

亚马逊、微软和谷歌将AI作为亏损引流工具。它们以成本价或低于成本价提供模型,通过计算、存储和数据服务弥补差额。例如,AWS Bedrock上Claude 3.5 Sonnet的定价通常比Anthropic的直接API定价低20-30%。这创造了一种反常激励:模型越成功,云厂商在推理上亏损越多,但它们在平台锁定上获益也越多。

| 公司 | 策略 | 模型定价趋势 | 主要收入来源 | 脆弱性 |
|---|---|---|---|---|
| OpenAI | 从溢价到商品化 | 18个月内下跌90% | API订阅 | 无护城河,高研发成本 |
| Meta | 开源免费赠送 | $0(自托管) | 广告、硬件 | 无直接AI收入 |
| Anthropic | 溢价利基市场 | 12个月内下跌80% | API、企业合作 | 亏损

时间归档

April 20262983 篇已发布文章

延伸阅读

AI Model Shelf Life Collapses: Why Leadership Is Now a Temporary StateThe era of a single AI model dominating for half a year is over. AINews data shows the interval between a new 'best' mod韩国股市突破6000万亿韩元:AI芯片是唯一引擎吗?韩国股市总市值首次突破6000万亿韩元大关,但并非普天同庆。AINews独家分析显示,超过40%的市值增长仅来自两家半导体巨头,这标志着由AI算力需求驱动的结构性重估——以及高度集中的风险。马斯克对决OpenAI:一场决定AI未来的董事会战争马斯克诉OpenAI案已正式开庭,原告要求罢免CEO萨姆·奥尔特曼,并让OpenAI回归其非营利初心。AINews深度解析这场围绕AI治理权与AGI控制权的终极博弈。银河通用与英伟达联手粉碎人形机器人“完美数据”神话人形机器人行业长期困于对纯净、完美标注数据的执念。银河通用与英伟达的最新合作打破了这一教条,证明最强大的学习能力恰恰源自真实世界中混乱、无序甚至失败的交互。这标志着从“数据完美主义”到“数据实用主义”的关键转折。

常见问题

这次模型发布“AI Models Expire Faster Than Milk: The Pricing Collapse Reshaping the Industry”的核心内容是什么?

The pricing of large language models has entered a state of freefall. AINews data reveals that the average 'shelf life' of a frontier model—the period during which it can command p…

从“Why are AI model prices dropping so fast?”看,这个模型发布为什么重要?

The pricing collapse is fundamentally a story of technical commoditization. The core architecture of modern LLMs—the Transformer—has become a standardized building block. While GPT-4 and Claude 3.5 were once considered p…

围绕“Is it still worth investing in AI startups?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。