Vercel 每百万Token仅0.01美元的缓存定价:是成本游戏,还是AI开发者的生态陷阱?

Hacker News April 2026
来源:Hacker NewsDeepSeek V4AI infrastructure归档:April 2026
Vercel AI Gateway 将 DeepSeek-v4 闪存缓存读取价格降至每百万 Token 仅 0.01 美元,比官方定价低 64%。这一激进举措绝非简单的价格战,而是一场精心策划的平台战略,旨在抢占开发者心智,重塑 AI 推理的经济格局。

Vercel AI Gateway 针对 DeepSeek-v4 闪存缓存读取推出的每百万 Token 0.01 美元新定价,并非一场简单的价格战。这是一次经过精密计算的基础设施布局。相比 DeepSeek 官方 0.028 美元以及 OpenRouter 与之持平的价格,Vercel 提供了高达 64% 的折扣。这背后要么是 Vercel 在主动承担亏损,要么是它利用自建的边缘缓存层绕过了上游成本。与其专业版仅提供 3% 折扣形成鲜明对比的是,这揭示了一个双层策略:先用超低闪存缓存定价吸引对价格敏感的试验性开发者,然后通过边缘计算、部署和可观测性等高利润服务实现变现。此举通过将 Vercel 插入为看门人角色,威胁到了 DeepSeek 等模型提供商和 OpenRouter 等聚合商。其终极目标远不止于成本。

技术深度解析

Vercel 能够以每百万 Token 0.01 美元的价格提供 DeepSeek-v4 闪存缓存读取(即 64% 的折扣),这取决于两种可能的架构策略。第一种,也是更合理的一种,是 Vercel 构建了自己的分布式缓存层,很可能利用了其全球边缘网络(由 Cloudflare 或类似 CDN 基础设施提供支持)。Vercel 并非将每次缓存命中都路由回 DeepSeek 的服务器,而是可以从更靠近用户的节点提供缓存的响应,从而大幅降低延迟和带宽成本。这类似于 CDN 缓存静态资源的方式,但应用对象是 LLM 的提示-补全对。缓存键将是提示的哈希值(或语义嵌入),而值则是生成的响应。对于闪存缓存,这很可能使用了部署在边缘位置的高速内存存储,如 Redis 或 Memcached。

第二种可能性是一种蓄意的“亏本引流”策略,即 Vercel 通过补贴成本来获取用户。然而,考虑到 Vercel 在优化基础设施成本方面的历史(例如其 Edge Functions 和 ISR 缓存),自建缓存的假设更为可信。一个相关的开源项目是 `vllm` 仓库(在 GitHub 上拥有超过 40,000 颗星),它实现了 PagedAttention 以实现高效的 KV-cache 管理。虽然 vllm 通常用于自托管推理,但 Vercel 可能在网关层面应用了类似的缓存原则。另一个项目是 `GPTCache`(拥有超过 7,000 颗星),这是一个为 LLM 查询创建语义缓存的库。Vercel 的实现可能更进一步,将其与自己的边缘函数和分析工具集成。

技术上的权衡在于缓存命中率与准确性。语义缓存可以提供相似的提示而无需重新运行模型,但它存在提供过时或略微错误响应的风险。Vercel 的闪存缓存层可能使用了更激进、保真度更低的缓存(例如精确匹配或短 TTL),以最大化成本节约,而专业版则使用更保守、准确性保证更高的缓存。这解释了定价差异:闪存缓存之所以便宜,是因为它接受了较低的可靠性,而专业缓存则因其一致性而收取溢价。

数据要点: 闪存缓存和专业缓存之间 64% 的价格差距并非随意设定。它反映了一个深思熟虑的技术决策:为实验提供一个低成本、低可靠性的层级,同时为生产工作负载保留高保真度的缓存。

关键参与者与案例研究

| 参与者 | DeepSeek-v4 缓存读取价格(每百万 Token) | 相比官方折扣 | 关键策略 |
|---|---|---|---|
| DeepSeek 官方 | $0.028 | 基准线 | 直接模型访问,完全控制 |
| OpenRouter | $0.028 | 0% | 聚合器,多模型路由 |
| Vercel AI Gateway (闪存) | $0.01 | 64% | 亏本引流 / 自建缓存,生态系统锁定 |
| Vercel AI Gateway (专业版) | $0.027 | 3% | 更高可靠性,优质服务 |

数据要点: Vercel 的闪存层是一个异类。对于纯粹的转售商而言,64% 的折扣是不可持续的,这证实了 Vercel 要么在构建自己的基础设施,要么在为了长期的生态系统收益而接受短期亏损。OpenRouter 与官方定价持平,表明他们缺乏仅靠成本竞争所需的规模或动力。

Vercel 的策略与 AWS 早期对 S3 的策略如出一辙:提供廉价的存储来吸引开发者入门,然后向上销售计算、分析和其他服务。对于 AI,Vercel 正将网关定位为入口点,以缓存定价作为诱饵。真正的收入来自 Vercel 的核心产品:Edge Functions、Serverless Functions 和可观测性工具。使用 Vercel AI Gateway 的开发者更有可能将其整个应用程序部署在 Vercel 上,从而形成一个粘性生态系统。

DeepSeek 面临两难境地。如果他们降低自己的缓存价格以参与竞争,就会侵蚀自己的收入。如果不降价,他们就有可能将开发者的心智份额拱手让给 Vercel 的网关。作为纯粹的聚合商,OpenRouter 的筹码更少——他们依赖模型提供商的利润空间,无法轻易吸收亏损。

行业影响与市场动态

这一定价举措标志着一个更广泛的趋势:AI 模型访问的商品化。随着模型变得功能更强大、数量更多,价值正从模型本身转移到为其提供服务的基设施上。Vercel 押注开发者会选择便利性和生态系统集成,而不是原始的模型成本。这让人想起云提供商(AWS、Azure、GCP)如何将计算和存储商品化,然后通过更高级别的服务捕获价值。

AI 推理市场预计将从 2024 年的 60 亿美元增长到 2030 年的超过 400 亿美元(来源:AINews 基于行业报告的内部估算)。网关层——负责处理路由、缓存、日志记录和速率限制——是一个关键的瓶颈点。通过提供超低缓存定价,Vercel 实际上是在购买这一层的市场份额。如果他们捕获了相当一部分开发者流量,他们就能有效地控制 AI 应用栈中利润丰厚的中间层。

对于开发者而言,短期收益是显而易见的:更低的成本、更低的延迟。但长期风险是供应商锁定。一旦你的应用围绕 Vercel 的缓存和网关 API 构建,迁移到另一个平台就变得成本高昂。Vercel 的定价结构旨在奖励深度集成:使用 Vercel 进行部署、函数和可观测性的开发者,将从其 AI 网关中获得最大价值。这创造了一个良性循环(对 Vercel 而言)和一个恶性循环(对竞争对手而言)。

最终,Vercel 的 $0.01/M Token 定价不仅仅关乎缓存。它关乎控制 AI 开发者的工作流程。如果成功,Vercel 将从“托管你网站的地方”转变为“构建 AI 应用的地方”。对于 DeepSeek 和 OpenRouter 来说,警钟已经敲响。他们需要迅速创新——要么通过提供更好的缓存技术,要么通过建立自己的生态系统——否则就有可能沦为 Vercel 基础设施战略中的商品化后端。

更多来自 Hacker News

Git-LFS令牌大削减:版本控制如何将AI代理成本降低95%AINews发现了一项变革性的AI代理基础设施进步:一种基于Git和大文件存储(LFS)的统一输出格式,可将令牌消耗降低高达95%。核心创新简单而深刻:不再将工具输出——JSON数据块、图像、日志、API响应——编码为高密度文本字符串并反复无标题The explosive growth of AI agents—from shopping assistants like Amazon's Rufus to coding copilots like GitHub Copilot—is零LLM、600行Python:PRD直转API的革命,挑战AI编程狂潮在每一家初创公司和大型企业都争先恐后将LLM嵌入开发管线的时代,一个轻量级开源项目悄然崛起,成为有力的反例。该项目仅用600行Python代码编写,能将标准的产品需求文档(PRD)直接编译为功能完整的FastAPI应用——包括端点、数据模型查看来源专题页Hacker News 已收录 4353 篇文章

相关专题

DeepSeek V446 篇相关文章AI infrastructure285 篇相关文章

时间归档

April 20263042 篇已发布文章

延伸阅读

提示缓存:AI部署中LLM成本控制的隐秘战场随着企业大规模部署大语言模型,Token成本正在悄然飙升。提示缓存技术通过复用跨查询的公共前缀来消除冗余计算,正成为关键的成本杠杆,可将Token消耗削减30%-70%并降低延迟。本文深入剖析这项技术、其商业影响,以及它为何可能重塑AI部署AbTARS:开源框架让AI智能体实现自我修复,挑战集中式AI服务霸权开源框架AbTARS为自托管AI智能体引入了持久化记忆与五层自愈架构,直击当前智能体最致命的脆弱性。它能让智能体从故障中自主恢复、维持长期上下文,无需人工干预,从而在可靠性上挑战集中式AI服务的统治地位。Suture:专治LLM流式输出JSON截断的反向代理,基础设施层新利器开源新工具Sute正解决LLM生产部署中一个隐蔽却致命的问题:流式输出导致的JSON截断。作为反向代理,它缓冲流数据、检测不完整JSON结构并自动修复,再转发给客户端——这一模型无关、语言无关的解决方案,有望成为AI应用的关键基础设施。TokkeyCC 的 $0.22/百万 Token API:AI 推理作为高端服务的终结TokkeyCC 推出统一 API,将 100 个 AI 模型——从大语言模型到代码生成器和图像合成引擎——以每百万 Token 0.22 美元的固定费率打包,完全兼容 OpenAI 的 API 格式。这一价格点比主流云服务低一个数量级,标

常见问题

这次公司发布“Vercel's $0.01/M Token Cache Pricing: Cost Play or Ecosystem Trap for AI Developers?”主要讲了什么?

Vercel AI Gateway's new pricing for DeepSeek-v4 flash cache reads at $0.01 per million tokens is not a simple price war. It is a calculated infrastructure play. By offering a 64% d…

从“Vercel AI Gateway cache pricing strategy”看,这家公司的这次发布为什么值得关注?

Vercel's ability to offer DeepSeek-v4 flash cache reads at $0.01 per million tokens—a 64% discount—hinges on two possible architectural strategies. The first, and more plausible, is that Vercel has built its own distribu…

围绕“DeepSeek-v4 flash cache vs professional tier”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。