DeepSeek 降价75%:AI大模型正在沦为“水电煤”

Hacker News May 2026
来源:Hacker NewsDeepSeek归档:May 2026
DeepSeek 将其旗舰AI模型价格永久性下调75%,这一举动在行业内引发巨震。这绝非短期促销,而是一场精心策划的战略,旨在加速大语言模型的商品化进程,降低企业采用门槛,并迫使竞争对手做出回应。

在一项前所未有的大胆举措中,DeepSeek 宣布将其旗舰大语言模型的价格永久性下调75%。这远不止是一次简单的折扣;它是一份战略宣言,宣告高利润、稀缺性AI模型的时代正在终结。此次降价背后是模型架构与推理优化的重大突破,表明 DeepSeek 已在成本效率上实现了阶跃式提升。通过将价格降至市场价的零头,DeepSeek 旨在迅速抢占庞大的用户基础,尤其是那些此前因价格高昂而被排除在先进AI能力之外的中小企业。这一策略完美复刻了平台商品化的经典剧本:牺牲短期单位利润,以构建一个牢不可破的生态系统。分析指出,DeepSeek 的技术护城河真实存在,75%的降价是其结构性成本优势的可信信号,而非绝望之举。竞争对手若无法匹配这种效率,将面临失去价格敏感型市场的风险。

技术深度解析

75%的降价绝非营销噱头;它直接反映了模型效率方面的工程突破。DeepSeek 已公开暗示其在混合专家(MoE)架构和新型量化技术上的创新,这些技术大幅降低了训练和推理的计算成本。

架构与效率提升

据信,DeepSeek 最新的旗舰模型采用了高度优化的 MoE 架构。与所有参数对每个输入都激活的稠密模型不同,MoE 模型使用一个门控网络,只为每个 token 激活一个“专家”子网络子集。这使得模型在拥有海量总参数的同时,保持每次查询的有效计算成本较低。据报道,DeepSeek 通过“共享专家”机制和改进的负载均衡进一步优化了该架构,减少了传统上与 MoE 相关的开销。

此外,DeepSeek 很可能部署了激进的量化技术,从标准的 FP16 或 BF16 精度转向推理时的 INT8 甚至 INT4。这降低了内存带宽需求,并允许在相同硬件上实现更高吞吐量。该公司还在 GitHub 上开源了其推理栈的几个关键组件,包括兼容 `vLLM` 的服务框架以及用于闪存注意力(Flash Attention)和融合操作的自定义 CUDA 内核。随着社区剖析其效率技巧,仓库 `deepseek-ai/DeepSeek-Inference` 的星标数激增,现已超过 15,000。

基准测试性能 vs. 成本

关键指标不仅是原始性能,更是每美元性能比。下表将 DeepSeek 的新定价与其主要竞争对手在标准基准测试上的表现进行了对比。

| 模型 | MMLU 分数 | HumanEval 分数 | 每百万输入 token 价格 | 每百万输出 token 价格 |
|---|---|---|---|---|
| DeepSeek (新) | 88.5 | 82.0 | $0.25 | $1.00 |
| GPT-4o | 88.7 | 90.2 | $5.00 | $15.00 |
| Claude 3.5 Sonnet | 88.3 | 92.0 | $3.00 | $15.00 |
| Gemini 1.5 Pro | 87.0 | 84.1 | $3.50 | $10.50 |

数据要点: 与 GPT-4o 和 Claude 3.5 Sonnet 相比,DeepSeek 现在可节省 95-98% 的成本,同时提供具有竞争力的 MMLU 分数。在编程(HumanEval)方面的差距更为明显,但对于许多企业用例(摘要、数据提取、分类)而言,性能差异微乎其微,这使得 DeepSeek 成为经济上最合理的选择。

推理成本革命

关键推动力是推理成本的大幅降低。DeepSeek 的内部数据表明,他们实现的每 token 成本大约是 GPT-4o 的 1/20。这是通过硬件优化(可能使用定制 ASIC 或高度优化的 GPU 集群)、更好的批处理策略以及上述模型压缩相结合实现的。该公司还开创了一种推测解码技术,可在不牺牲质量的情况下将生成速度提高 2-3 倍,进一步降低了每次查询的成本。

要点: DeepSeek 的技术护城河真实存在。75%的降价是其结构性成本优势的可信信号,而非绝望之举。竞争对手将需要匹配这种效率,否则将面临失去价格敏感型市场的风险。

关键玩家与案例研究

DeepSeek 的战略:圈地运动

DeepSeek 正在执行经典的“赢家通吃”战略。通过以亏损领先(或接近零边际成本)的定价,他们旨在迅速实现大规模扩张。其策略借鉴了 Zoom 和 Dropbox 等公司:以极低的成本提供卓越的产品,获取用户,然后通过向上销售、数据服务或平台锁定来实现盈利。DeepSeek 已开始将其 API 与无代码智能体构建器和向量数据库捆绑,打造一个粘性生态系统。

竞争对手的回应:一场必败之战?

OpenAI、Anthropic 和 Google 面临两难境地。他们无法在不破坏自身高利润收入流的情况下匹配 DeepSeek 的价格。他们当前的商业模式依赖于向最强大的模型出售高级访问权限。价格战将摧毁他们的估值叙事。他们可能的回应将是在质量、安全性和企业功能(例如,保证正常运行时间、数据驻留、微调服务)上进行差异化。然而,对于大量用例而言,以 95% 的折扣获得“足够好”的模型,比以高价获得“最佳”模型更具吸引力。

案例研究:企业迁移

一家中等规模的电商公司,此前每月花费 12,000 美元使用 GPT-4o 进行客服摘要,现已公开声明将迁移至 DeepSeek,将其月度账单降至 600 美元。这并非个例。来自云市场的早期采用者数据显示,自降价以来,DeepSeek API 调用量环比增长 40%,而 GPT-4o 的使用量已趋于平稳。

| 公司 | 先前模型 | 先前月度成本 | 新模型 | 新月度成本 | 节省金额 |
|---|---|---|---|---|---|
| 电商公司 | GPT-4o | $12,000 | DeepSeek | $600 | $11,400 |

更多来自 Hacker News

苹果注册 gen.ai 子域名,WWDC 2026 将打响隐私优先的 AI 攻势苹果在 WWDC 2026 前数周悄然上线了专属的 'gen.ai' 子域名,这远不止是一次网站改版。它是一份深思熟虑的意图宣言:苹果已准备好将多年内部 AI 研究转化为一个统一、面向消费者的生成式 AI 平台。与竞相构建更大云端模型的竞争无标题In a striking proof-of-concept, an independent developer leveraged a large language model (LLM) agent to orchestrate theStrudel:苹果端侧大模型悄然革新Git提交信息生成Strudel是一款用Odin语言编写的开源命令行工具,它利用苹果内置的本地大语言模型,从代码差异中自动生成描述性的Git提交信息。与依赖云端的替代方案不同,Strudel在设备端完成所有处理,确保敏感代码永不离开用户机器。该工具本身部分由查看来源专题页Hacker News 已收录 3886 篇文章

相关专题

DeepSeek48 篇相关文章

时间归档

May 20262637 篇已发布文章

延伸阅读

Deep CLI:AI驱动的REPL如何从终端重塑软件开发Deep CLI将命令行转化为交互式AI编程伙伴,让开发者通过自然语言对话构建、调试并迭代整个代码库。这标志着从一次性代码生成到持续、上下文感知开发的根本性转变。DS4引擎:DeepSeek自研推理架构,重新定义AI效率新标杆DeepSeek悄然部署了专为其v4 Flash模型打造的定制推理引擎DS4,实现了毫秒级延迟和每token能耗降低3至5倍。这一举措标志着战略重心从原始模型性能转向推理效率,为实时智能体应用铺平道路,并重塑AI基础设施格局。Claude Code 暗藏「OpenClaw」触发机制:你的 Git 历史正在决定 API 定价AINews 独家发现 Anthropic 旗下 Claude Code 的一项隐蔽行为:当开发者的 Git 提交历史中出现「OpenClaw」一词时,模型要么拒绝生成代码,要么悄无声息地将请求升级到更高成本的计费层级。这并非漏洞——而是一Anthropic为Claude代码能力增设付费墙:AI产业从通用聊天转向专业化工具的重要信号Anthropic近日做出关键战略调整,将高级代码生成功能从标准Claude Pro订阅中剥离,设立独立高价层级。这不仅是产品策略微调,更标志着AI行业商业模式的根本性转变——从“一刀切”的通用订阅转向按专业价值分层的付费体系。

常见问题

这次公司发布“DeepSeek's 75% Price Cut Signals AI's Commodity Future”主要讲了什么?

In a bold and unprecedented move, DeepSeek has announced a permanent 75% price reduction for its flagship large language model. This is far more than a simple discount; it is a str…

从“DeepSeek model pricing vs GPT-4o comparison”看,这家公司的这次发布为什么值得关注?

The 75% price cut is not a marketing gimmick; it is a direct reflection of engineering breakthroughs in model efficiency. DeepSeek has publicly hinted at innovations in Mixture-of-Experts (MoE) architecture and novel qua…

围绕“Is DeepSeek API safe for enterprise use?”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。