DeepSeek V4揭示权力转移：用户，而非建造者，正定义AI价值

DeepSeek V4已正式发布，表面上看，它在推理能力、多语言流畅度和成本效率方面实现了预期的代际飞跃。但在基准测试分数的背后，隐藏着一个更深刻的故事：此次发布凸显了AI行业日益加剧的分裂。多年来，主流观点一直认为最好的模型会获胜——通过扩展参数、优化架构、降低推理成本来占据价值链顶端。DeepSeek V4挑战了这一假设。我们的分析表明，随着模型能力接近饱和点，进一步改进的边际价值正在迅速缩小。如今真正的差异化因素不再是模型本身，而是它如何被部署、集成以及如何针对特定用户需求进行定制。定义AI价值的权力正在从模型建造者转移到模型用户手中。这一转变正在重塑AI行业的经济格局，应用层公司正成为价值创造的新中心。

技术深度解析

DeepSeek V4在其前代产品的混合专家（MoE）架构基础上进行了构建，但引入了多项关键创新。据报道，该模型采用了一种动态路由机制，与V3相比，可将令牌计算量减少15-20%，同时保持或提高复杂推理任务的准确性。该架构使用256个专家和top-2门控策略，但现在包含一个学习到的“专家亲和力”矩阵，使得路由器无需完整前向传播即可预测哪些专家对给定输入最有用。在生产环境中，这平均降低了30%的延迟。

在训练方面，DeepSeek V4在一个包含18万亿令牌的精选数据集上进行了训练，采用了一种新颖的多阶段课程学习策略，优先使用高质量的合成数据进行推理和代码生成。该模型在10,000块NVIDIA H100 GPU上使用FP8混合精度训练，实现了45%的模型算力利用率（MFU），相比V3的38%有显著提升。团队还引入了一种新的“对比对齐”技术，该技术微调模型，使其倾向于选择不仅准确而且简洁且可操作的响应——这体现了用户体验日益增长的重要性。

对于开发者，DeepSeek已在GitHub上开源了多个组件。`deepseek-moe-routing`仓库（目前拥有4,200颗星）提供了动态路由实现，而`deepseek-contrastive-align`（1,800颗星）则提供了对齐训练代码。这些仓库使社区能够复现并基于DeepSeek的效率优势进行构建。

| 基准测试 | DeepSeek V3 | DeepSeek V4 | GPT-4o (最新) | Claude 3.5 Sonnet |
|---|---|---|---|---|
| MMLU (5-shot) | 86.4 | 88.1 | 88.7 | 88.3 |
| HumanEval (pass@1) | 72.5 | 78.3 | 80.2 | 79.6 |
| GSM8K (8-shot) | 89.0 | 92.4 | 92.0 | 91.8 |
| 延迟 (毫秒, 1k tokens) | 320 | 220 | 280 | 260 |
| 成本 ($/1M tokens) | $0.48 | $0.35 | $5.00 | $3.00 |

数据要点： DeepSeek V4在关键基准测试上缩小了与前沿模型的差距，同时提供了显著更低的延迟和成本。30%的延迟降低和27%的成本削减比1-2个百分点的准确率提升更具影响力，这凸显了效率和用户体验如今已成为竞争的主战场。

关键参与者与案例研究

DeepSeek V4的发布对几个关键参与者具有直接影响。OpenAI和Anthropic仍然是基准制定者，但随着像DeepSeek V4这样的开放权重模型接近同等水平，它们的高昂定价越来越难以自圆其说。预计今年晚些时候发布的Meta的Llama 4将面临压力，不仅要提供性能，还要提供使部署无缝化的生态系统工具。

更有趣的是应用层的公司。AI驱动的代码编辑器Cursor已将DeepSeek V4作为可选后端集成，理由是其实时代码补全的低延迟。Notion AI正在测试DeepSeek V4用于其问答和摘要功能，被其相比GPT-4o降低70%的成本所吸引。Replit正在为其Ghostwriter代理探索DeepSeek V4，强调该模型强大的代码生成能力。

| 公司/产品 | 之前使用的模型 | 现在使用的模型（或测试中） | 切换的关键驱动因素 |
|---|---|---|---|
| Cursor | GPT-4o, Claude 3.5 | DeepSeek V4 (可选) | 延迟 (220ms vs 280ms) |
| Notion AI | GPT-4o | DeepSeek V4 (测试中) | 成本 ($0.35 vs $5.00 per 1M tokens) |
| Replit Ghostwriter | Codex, GPT-4 | DeepSeek V4 (测试中) | 代码生成准确率 (78.3% HumanEval) |
| Jasper AI | GPT-4, Claude | DeepSeek V4 (部分) | 多语言流畅度, 成本 |

数据要点： 迁移模式很清晰：应用层公司正优先考虑成本和延迟，而非边际基准提升。DeepSeek V4相比GPT-4o降低了93%的成本，使其对高容量用例具有不可抗拒的吸引力，即便它在MMLU上落后0.6个百分点。

行业影响与市场动态

从模型建造者到模型用户的权力转移正在重塑AI行业的经济格局。风险投资数据揭示了一个明显趋势：在2025年第一季度，62%的AI初创公司资金流向了应用层公司，而2023年第一季度这一比例为38%。基础设施和模型层初创公司的份额同期从45%下降至22%。

| 融资类别 | 2023年第一季度份额 | 2025年第一季度份额 | 2025年第一季度总融资额 |
|---|---|---|---|
| 应用层 | 38% | 62% | $8.2B |
| 模型层 | 30% | 15% | $2.0B |
| 基础设施/工具 | 15% | 22% | $2.9B |
| 其他 | 17% | 1% | $0.1B |

数据要点： 市场正在用资金投票。应用层初创公司吸引了大部分资金，这反映了价值创造正在向技术栈上层移动的信念。模型建造者被迫在价格和开放性上竞争，而基础设施提供商（例如云平台、向量数据库）则受益于日益增长的部署活动。

这种转变具有深远的影响。“模型即服务”市场正在

时间归档

延伸阅读

常见问题

这次模型发布“DeepSeek V4 Reveals Power Shift: Users, Not Builders, Now Define AI Value”的核心内容是什么？

DeepSeek V4 has arrived, and on the surface, it delivers the expected generational leap in reasoning, multilingual fluency, and cost efficiency. But beneath the benchmark scores li…

从“DeepSeek V4 vs GPT-4o cost comparison for startups”看，这个模型发布为什么重要？

DeepSeek V4 builds on its predecessor's Mixture-of-Experts (MoE) architecture but introduces several key innovations. The model reportedly employs a dynamic routing mechanism that reduces token computation by 15-20% comp…

围绕“How to deploy DeepSeek V4 on AWS SageMaker”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。