DeepSeek V4 Pro 75%折扣点燃AI价格战:战略布局还是绝望之举?

Hacker News May 2026
来源:Hacker News归档:May 2026
DeepSeek以75%折扣推出旗舰模型V4 Pro,有效期至5月31日。这绝非一场简单的促销——而是一次精心策划的战略博弈,旨在抢占企业市场份额、逼迫对手陷入利润泥潭,并加速前沿AI的商品化进程。

2025年5月7日,DeepSeek宣布对其旗舰大语言模型V4 Pro推出限时75%折扣,有效期至5月31日。此举将访问这一最强开源权重模型的成本从每百万输入token约2.00美元骤降至0.50美元,输出价格也按比例下调。这一激进定价直接冲击了当前市场格局——OpenAI、Anthropic和Google一直为其最先进模型维持高价。DeepSeek的策略是多层次的:首先,它制造了紧迫感,促使企业客户在截止日期前锁定合同,迅速扩大用户基础;其次,它加速了多样化真实世界使用数据的收集——这是一项关键资源,可用于模型优化和竞争壁垒构建。这场价格战不仅重塑了AI行业的定价逻辑,更可能引发一场关于技术价值与商业可持续性的深刻反思。

技术深度解析

DeepSeek V4 Pro基于混合专家(MoE)架构,这一设计选择是其成本优势的核心。与GPT-4o等密集模型(每个token激活所有参数)不同,MoE模型每次前向传播仅激活部分“专家”网络。V4 Pro据称使用16个专家,每个token仅激活其中2个,使其有效参数量约为400亿,尽管总参数量超过3000亿。这种稀疏性大幅降低了推理计算成本。

DeepSeek还在自定义推理优化上投入了大量资源。其开源仓库`DeepSeek-Infer`(GitHub上已获超12000星)详细介绍了动态专家缓存、MoE门控融合内核以及多头潜在注意力(MLA)的自定义CUDA实现等技术。MLA将键值缓存内存占用比标准多头注意力减少约75%,这对于处理长上下文请求(V4 Pro支持高达128K token)至关重要。

基准性能与成本对比

| 模型 | MMLU(5-shot) | HumanEval Pass@1 | 每百万输入token成本 | 每百万输出token成本 | 有效参数量(估计) |
|---|---|---|---|---|---|
| DeepSeek V4 Pro(折扣价) | 87.2 | 82.4 | $0.50 | $1.50 | ~400亿(激活) |
| DeepSeek V4 Pro(常规价) | 87.2 | 82.4 | $2.00 | $6.00 | ~400亿(激活) |
| GPT-4o | 88.7 | 90.2 | $5.00 | $15.00 | ~2000亿(密集) |
| Claude 3.5 Sonnet | 88.3 | 84.0 | $3.00 | $15.00 | — |
| Gemini 1.5 Pro | 86.4 | 78.5 | $3.50 | $10.50 | — |

数据要点: 折扣后的DeepSeek V4 Pro每token成本仅为GPT-4o的十分之一,同时MMLU得分达到其98%。这种性价比在前沿模型中前所未有,将迫使每个竞争对手为自己的溢价辩护。

DeepSeek的工程团队还发表了一篇关于其“FlashMoE”内核的论文,该内核通过将专家计算与全对全通信重叠,实现了比标准MoE实现高1.5倍的吞吐量提升。这在配备NVLink等高带宽互连的集群上尤其有效。该公司的推理栈设计为能在NVIDIA H100及其自研ASIC(“DeepSeek Chip”,于2024年第四季度首次部署)上高效运行,这赋予了其独特的硬件-软件协同优化优势,而仅依赖NVIDIA硬件的竞争对手难以轻易复制。

关键玩家与案例研究

DeepSeek引发的价格战对主要AI模型提供商产生了直接且不对称的影响。

OpenAI面临最大的战略困境。其商业模式严重依赖高利润的API收入来资助GPT-5及更大模型的庞大训练任务。匹配DeepSeek的定价将意味着其旗舰产品收入削减75%,考虑到其成本结构(密集模型天生服务成本更高),这难以维持。相反,OpenAI可能会加速推出更小、更便宜的“GPT-4o mini”变体,但这会使其产品线碎片化并让客户感到困惑。

Anthropic将Claude定位为“安全、企业级”的替代方案,以卓越的安全功能和宪法AI为溢价辩护。然而,许多企业买家现在开始质疑:安全性是否值得10倍的价格溢价?Anthropic的回应是提供批量折扣和长期合同,但并未匹配那引人注目的折扣。

Google处于独特位置。凭借Gemini 1.5 Pro,它拥有最强大的硬件基础设施(TPU),并可能通过其云业务补贴定价。然而,Google的组织惯性和产品碎片化(Bard、Gemini、Duet AI)阻碍了统一的定价回应。其最近对Gemini 1.5 Pro的20%降价被视为力度不足。

案例研究:中型AI公司“Latent Labs”

Latent Labs是一家50人的AI初创公司,为企业DevOps团队构建代码生成工具。折扣宣布后,他们立即从GPT-4o切换到了DeepSeek V4 Pro。其CTO报告称,API成本降低了92%(从每月8000美元降至640美元),而根据内部测试套件衡量,代码正确性仅下降了3%。节省下来的资金使他们能够额外雇佣两名工程师。这个案例说明了“弹性需求”效应:更低的价格解锁了以前不经济的新用例和客户群。

竞争性定价对比(折扣后)

| 提供商 | 旗舰模型 | 输入成本/百万token | 输出成本/百万token | 上下文窗口 |
|---|---|---|---|---|
| DeepSeek | V4 Pro(折扣价) | $0.50 | $1.50 | 128K |
| OpenAI | GPT-4o | $5.00 | $15.00 | 128K |
| Anthropic | Claude 3.5 Sonnet | $3.00 | $15.00 | 200K |
| Google | Gemini 1.5 Pro | $2.80 | $8.40 | 1M |
| Meta | Llama 3.1 405B(自托管) | ~$0.30(估计计算成本) | ~$0.90(估计计算成本) | 128K |

数据要点: DeepSeek的折扣价格在性能与成本之间实现了前所未有的平衡,迫使整个行业重新评估其定价策略。

更多来自 Hacker News

一条推文代价20万美元:AI Agent对社交信号的致命信任2026年初,一个在Solana区块链上管理加密货币投资组合的自主AI Agent,被诱骗将价值20万美元的USDC转移至攻击者钱包。触发点是一条精心伪造的推文,伪装成来自可信DeFi协议的智能合约升级通知。该Agent被设计为抓取社交媒体Unsloth 联手 NVIDIA,消费级 GPU 大模型训练速度飙升 25%专注于高效 LLM 微调的初创公司 Unsloth 与 NVIDIA 合作,在 RTX 4090 等消费级 GPU 上实现了 25% 的训练速度提升。该优化针对 CUDA 内核内存带宽调度,从硬件中榨取出每一丝性能——此前这些硬件被认为不足Appctl:将文档一键转化为LLM工具,AI代理的“最后一公里”终于打通AINews发现了一个名为Appctl的开源项目,它成功弥合了大语言模型与现实系统之间的鸿沟。通过将现有文档和数据库模式转化为MCP工具,Appctl让LLM能够直接执行操作——例如在CRM中创建记录、更新工单状态或提交网页表单——而无需定查看来源专题页Hacker News 已收录 3034 篇文章

时间归档

May 2026784 篇已发布文章

延伸阅读

DeepClaude将AI代码代理成本压缩17倍:开发者工具的“拼多多时刻”DeepClaude,一种将DeepSeek V4 Pro的推理能力与Claude Code的智能体循环相结合的新型混合系统,在代码生成领域实现了惊人的17倍成本压缩。这一突破标志着AI代理经济学——而非单纯的原始性能——正成为主要的竞争战SQLite获美国国会图书馆背书:一场静默的数字保存革命美国国会图书馆正式将SQLite纳入其推荐存储格式清单。这绝非一次例行更新,而是标志着数字保存领域向自包含、开放、不依赖基础设施的数据存储方式的根本性转变,挑战了数十年来对复杂专有格式的依赖。光伏+储能度电成本降至54美元:化石能源经济学的终结光伏+储能的平准化度电成本已降至每兆瓦时54美元,创下历史新低,低于煤电和气电。这标志着可调度的清洁电力已成为最便宜的基础负荷电源,从根本上改写了全球能源经济学。英伟达“影子库”脚本被判纯侵权:AI数据管道面临生死劫美国联邦法官裁定,英伟达用于从受版权保护作品中构建AI训练数据集的内部脚本“除侵权外别无他用”,直接驳回了该公司的合理使用辩护,标志着AI公司获取训练数据的方式将面临前所未有的严格审查。

常见问题

这次模型发布“DeepSeek V4 Pro 75% Discount Ignites AI Price War: Strategy or Desperation?”的核心内容是什么?

On May 7, 2025, DeepSeek announced a limited-time 75% discount on its flagship large language model, V4 Pro, valid until May 31. The move slashes the cost of accessing one of the m…

从“DeepSeek V4 Pro vs GPT-4o cost comparison for enterprise”看,这个模型发布为什么重要?

DeepSeek V4 Pro is built on a Mixture-of-Experts (MoE) architecture, a design choice that is central to its cost advantage. Unlike dense models like GPT-4o, which activate all parameters for every token, MoE models activ…

围绕“Is DeepSeek V4 Pro safe for enterprise data privacy?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。