AI模型过期比牛奶还快：定价崩盘如何重塑行业格局

大语言模型的定价已进入自由落体状态。AINews数据显示，前沿模型的平均“保质期”——即能维持溢价定价的周期——已从2023年的约12个月骤降至2026年的不足3个月。这并非暂时的市场修正，而是由三股力量汇聚而成的结构性转变。首先，Meta的Llama系列与Mistral AI等开源模型侵蚀了专有模型的护城河，以零推理成本提供可比性能。其次，亚马逊云服务、微软Azure与谷歌云等主流云厂商正大力补贴推理成本，常以低于成本的价格出售API访问权限，以将客户锁定在其更广泛的生态系统中。第三，市场充斥着数百个性能趋同的模型，差异化几乎消失。这种“商品化”螺旋意味着，即便是最先进的AI模型也正迅速沦为低利润、高周转的商品，迫使整个行业重新思考如何创造和捕获价值。

技术深度解析

定价崩盘本质上是一个技术商品化的故事。现代LLM的核心架构——Transformer——已成为标准化的构建模块。尽管GPT-4和Claude 3.5曾被视为专有奇迹，但其底层技术如今已在开源仓库中被广泛复制。

开源基准追赶

最重要的技术驱动力是开源模型在专有基准上的快速收敛。以Llama家族的演进为例：Llama 2（2023年7月）在MMLU上落后GPT-4约15个百分点；Llama 3（2024年4月）将差距缩小至5个百分点以内；Llama 4（预计2025年）预计将在多项关键指标上匹配或超越GPT-4o。这一轨迹并非偶然——它反映了开源社区复制并改进已发表技术（如基于人类反馈的强化学习RLHF、混合专家模型MoE与高级量化）的能力。

量化革命

第二个技术因素是通过量化大幅降低推理成本。GPTQ、AWQ与GGUF等技术使模型能在消费级硬件上运行，且精度损失极小。2023年需要A100 GPU的模型，到2025年可在MacBook Air上运行。这已将单次查询成本从美分降至美分的零头，使提供商提供免费层级或近乎零定价在经济上成为可能。

MoE效率飞跃

由Mixtral 8x7B推广、后被GPT-4和Gemini采用的混合专家架构进一步压缩了成本。通过每个token仅激活部分参数，MoE模型以更低计算量实现高性能。这意味着提供商能用相同硬件服务更多用户，从而降低单次查询成本，并实施激进定价策略。

| 模型 | 发布日期 | MMLU得分（5-shot） | 每百万token输入价格 | 较峰值价格跌幅 |
|---|---|---|---|---|
| GPT-4 | 2023年3月 | 86.4 | $30.00 | — |
| GPT-4o | 2024年5月 | 88.7 | $5.00 | -83% |
| GPT-4o-mini | 2024年7月 | 82.0 | $0.15 | -99.5% |
| Claude 3 Opus | 2024年3月 | 86.8 | $15.00 | — |
| Claude 3.5 Sonnet | 2024年6月 | 88.3 | $3.00 | -80% |
| Llama 3 70B（开源） | 2024年4月 | 82.0 | $0.00（自托管） | -100% |
| Mistral Large 2 | 2024年7月 | 84.0 | $2.00 | -87% |

数据要点： 表格清晰显示了一个模式：GPT-4发布后的12-16个月内，可比性能的价格暴跌超过80%，而开源选项提供零边际成本。专有模型的“溢价”已蒸发殆尽。

关键玩家与案例分析

价格战在主要玩家中创造了截然不同的赢家与输家。

OpenAI：价格屠夫

OpenAI在降价方面最为激进，将GPT-4o的成本削减83%，并推出GPT-4o-mini，价格较原始GPT-4折扣99.5%。这一策略是防御性的：通过让自家模型变得廉价，他们希望留住可能转向开源或更便宜替代品的客户。然而，这蚕食了自身收入，并引发疑问：他们将如何收回训练GPT-5等未来模型预计花费的50-100亿美元？

Meta：颠覆者

Meta的策略最为激进：免费赠送皇冠明珠。通过以开放权重形式发布Llama 3和4，Meta实际上摧毁了专有模型的定价权。该公司的赌注是：将模型层商品化将推动对其硬件（通过定制芯片）和社交平台（AI功能成为独家卖点）的需求。这是一项长期布局，以牺牲短期AI收入换取生态系统主导地位。

Mistral AI：欧洲挑战者

Mistral采取了混合模式：发布小型高效的开源模型（Mistral 7B、Mixtral 8x7B），同时为大型模型提供溢价API。其定价始终比OpenAI低50-70%，迫使整个市场下行。其成功表明，即便资金充裕的初创公司也无法在当前环境中维持溢价定价。

云厂商：补贴者

亚马逊、微软和谷歌将AI作为亏损引流工具。它们以成本价或低于成本价提供模型，通过计算、存储和数据服务弥补差额。例如，AWS Bedrock上Claude 3.5 Sonnet的定价通常比Anthropic的直接API定价低20-30%。这创造了一种反常激励：模型越成功，云厂商在推理上亏损越多，但它们在平台锁定上获益也越多。

| 公司 | 策略 | 模型定价趋势 | 主要收入来源 | 脆弱性 |
|---|---|---|---|---|
| OpenAI | 从溢价到商品化 | 18个月内下跌90% | API订阅 | 无护城河，高研发成本 |
| Meta | 开源免费赠送 | $0（自托管） | 广告、硬件 | 无直接AI收入 |
| Anthropic | 溢价利基市场 | 12个月内下跌80% | API、企业合作 | 亏损

时间归档

延伸阅读

常见问题

这次模型发布“AI Models Expire Faster Than Milk: The Pricing Collapse Reshaping the Industry”的核心内容是什么？

The pricing of large language models has entered a state of freefall. AINews data reveals that the average 'shelf life' of a frontier model—the period during which it can command p…

从“Why are AI model prices dropping so fast?”看，这个模型发布为什么重要？

The pricing collapse is fundamentally a story of technical commoditization. The core architecture of modern LLMs—the Transformer—has become a standardized building block. While GPT-4 and Claude 3.5 were once considered p…

围绕“Is it still worth investing in AI startups?”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。