DeepSeek 降价75%：AI大模型正在沦为“水电煤”

在一项前所未有的大胆举措中，DeepSeek 宣布将其旗舰大语言模型的价格永久性下调75%。这远不止是一次简单的折扣；它是一份战略宣言，宣告高利润、稀缺性AI模型的时代正在终结。此次降价背后是模型架构与推理优化的重大突破，表明 DeepSeek 已在成本效率上实现了阶跃式提升。通过将价格降至市场价的零头，DeepSeek 旨在迅速抢占庞大的用户基础，尤其是那些此前因价格高昂而被排除在先进AI能力之外的中小企业。这一策略完美复刻了平台商品化的经典剧本：牺牲短期单位利润，以构建一个牢不可破的生态系统。分析指出，DeepSeek 的技术护城河真实存在，75%的降价是其结构性成本优势的可信信号，而非绝望之举。竞争对手若无法匹配这种效率，将面临失去价格敏感型市场的风险。

技术深度解析

75%的降价绝非营销噱头；它直接反映了模型效率方面的工程突破。DeepSeek 已公开暗示其在混合专家（MoE）架构和新型量化技术上的创新，这些技术大幅降低了训练和推理的计算成本。

架构与效率提升

据信，DeepSeek 最新的旗舰模型采用了高度优化的 MoE 架构。与所有参数对每个输入都激活的稠密模型不同，MoE 模型使用一个门控网络，只为每个 token 激活一个“专家”子网络子集。这使得模型在拥有海量总参数的同时，保持每次查询的有效计算成本较低。据报道，DeepSeek 通过“共享专家”机制和改进的负载均衡进一步优化了该架构，减少了传统上与 MoE 相关的开销。

此外，DeepSeek 很可能部署了激进的量化技术，从标准的 FP16 或 BF16 精度转向推理时的 INT8 甚至 INT4。这降低了内存带宽需求，并允许在相同硬件上实现更高吞吐量。该公司还在 GitHub 上开源了其推理栈的几个关键组件，包括兼容 `vLLM` 的服务框架以及用于闪存注意力（Flash Attention）和融合操作的自定义 CUDA 内核。随着社区剖析其效率技巧，仓库 `deepseek-ai/DeepSeek-Inference` 的星标数激增，现已超过 15,000。

基准测试性能 vs. 成本

关键指标不仅是原始性能，更是每美元性能比。下表将 DeepSeek 的新定价与其主要竞争对手在标准基准测试上的表现进行了对比。

| 模型 | MMLU 分数 | HumanEval 分数 | 每百万输入 token 价格 | 每百万输出 token 价格 |
|---|---|---|---|---|
| DeepSeek (新) | 88.5 | 82.0 | $0.25 | $1.00 |
| GPT-4o | 88.7 | 90.2 | $5.00 | $15.00 |
| Claude 3.5 Sonnet | 88.3 | 92.0 | $3.00 | $15.00 |
| Gemini 1.5 Pro | 87.0 | 84.1 | $3.50 | $10.50 |

数据要点： 与 GPT-4o 和 Claude 3.5 Sonnet 相比，DeepSeek 现在可节省 95-98% 的成本，同时提供具有竞争力的 MMLU 分数。在编程（HumanEval）方面的差距更为明显，但对于许多企业用例（摘要、数据提取、分类）而言，性能差异微乎其微，这使得 DeepSeek 成为经济上最合理的选择。

推理成本革命

关键推动力是推理成本的大幅降低。DeepSeek 的内部数据表明，他们实现的每 token 成本大约是 GPT-4o 的 1/20。这是通过硬件优化（可能使用定制 ASIC 或高度优化的 GPU 集群）、更好的批处理策略以及上述模型压缩相结合实现的。该公司还开创了一种推测解码技术，可在不牺牲质量的情况下将生成速度提高 2-3 倍，进一步降低了每次查询的成本。

要点： DeepSeek 的技术护城河真实存在。75%的降价是其结构性成本优势的可信信号，而非绝望之举。竞争对手将需要匹配这种效率，否则将面临失去价格敏感型市场的风险。

关键玩家与案例研究

DeepSeek 的战略：圈地运动

DeepSeek 正在执行经典的“赢家通吃”战略。通过以亏损领先（或接近零边际成本）的定价，他们旨在迅速实现大规模扩张。其策略借鉴了 Zoom 和 Dropbox 等公司：以极低的成本提供卓越的产品，获取用户，然后通过向上销售、数据服务或平台锁定来实现盈利。DeepSeek 已开始将其 API 与无代码智能体构建器和向量数据库捆绑，打造一个粘性生态系统。

竞争对手的回应：一场必败之战？

OpenAI、Anthropic 和 Google 面临两难境地。他们无法在不破坏自身高利润收入流的情况下匹配 DeepSeek 的价格。他们当前的商业模式依赖于向最强大的模型出售高级访问权限。价格战将摧毁他们的估值叙事。他们可能的回应将是在质量、安全性和企业功能（例如，保证正常运行时间、数据驻留、微调服务）上进行差异化。然而，对于大量用例而言，以 95% 的折扣获得“足够好”的模型，比以高价获得“最佳”模型更具吸引力。

案例研究：企业迁移

一家中等规模的电商公司，此前每月花费 12,000 美元使用 GPT-4o 进行客服摘要，现已公开声明将迁移至 DeepSeek，将其月度账单降至 600 美元。这并非个例。来自云市场的早期采用者数据显示，自降价以来，DeepSeek API 调用量环比增长 40%，而 GPT-4o 的使用量已趋于平稳。

| 公司 | 先前模型 | 先前月度成本 | 新模型 | 新月度成本 | 节省金额 |
|---|---|---|---|---|---|
| 电商公司 | GPT-4o | $12,000 | DeepSeek | $600 | $11,400 |

时间归档

延伸阅读

常见问题

这次公司发布“DeepSeek's 75% Price Cut Signals AI's Commodity Future”主要讲了什么？

In a bold and unprecedented move, DeepSeek has announced a permanent 75% price reduction for its flagship large language model. This is far more than a simple discount; it is a str…

从“DeepSeek model pricing vs GPT-4o comparison”看，这家公司的这次发布为什么值得关注？

The 75% price cut is not a marketing gimmick; it is a direct reflection of engineering breakthroughs in model efficiency. DeepSeek has publicly hinted at innovations in Mixture-of-Experts (MoE) architecture and novel qua…

围绕“Is DeepSeek API safe for enterprise use?”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。