AI存储战争：价格操纵诉讼、中国HBM突破与新算力格局

本周，AI硬件领域被两件看似无关实则紧密相连的事件所震动。首先，美国针对三星、SK海力士和美光科技提起了一项合并集体诉讼，指控它们合谋人为抬高DRAM和NAND闪存芯片的价格——这些芯片是AI训练基础设施的生命线。诉状指控这些公司存在协调一致的限产和定价计划，这种行径历史上已让超大规模云厂商和AI实验室损失数十亿美元。几乎同时，有报道称中国存储制造商长鑫存储（CXMT）已与全球最大云和AI公司之一腾讯签署了一份价值近30亿美元的多年期大单，供应高带宽内存（HBM）。这笔交易代表着中国在AI存储供应链上的重大突破，直接挑战了由韩国和美国企业主导的现有格局。这两件事共同揭示了一个核心事实：HBM——这种将DRAM芯片垂直堆叠并通过硅通孔（TSV）连接的特殊内存——已成为AI军备竞赛中最关键的瓶颈。无论是价格操纵诉讼还是中国供应商的崛起，都标志着全球AI基础设施战争已从GPU层面深入到存储层面。

技术深度解析

这场故事的核心是高带宽内存（HBM），一种通过硅通孔（TSV）垂直堆叠并连接的特殊DRAM。与传统DDR内存不同，HBM提供了极宽的数据总线（每堆叠1024位）和显著更低的延迟，这对于向NVIDIA H100和B200等GPU中的大规模并行处理单元输送数据至关重要。当前标准HBM3e每引脚数据传输速率高达9.2 Gbps，每堆叠提供惊人的1.2 TB/s带宽。这不是奢侈品，而是必需品。没有HBM，世界上最强大的GPU将陷入数据饥渴，大部分时钟周期都处于等待状态（即所谓的“内存墙”瓶颈）。

这起诉讼瞄准的是控制这一关键组件的寡头垄断格局。三星、SK海力士和美光合计控制着全球超过95%的HBM市场。原告指控这些公司通过共享生产计划和定价目标违反了《谢尔曼反托拉斯法》，实质上形成了一个卡特尔。其技术含义深远：如果价格被人为抬高，将直接推高AI训练的总拥有成本（TCO）。例如，一台H100服务器节点的成本可能超过30万美元，其中HBM占物料清单（BOM）的很大一部分。

长鑫存储（CXMT）的登场改变了局面。虽然CXMT目前还不是最先进HBM3e堆叠的领导者，但其与腾讯的这笔交易是一个分水岭时刻。CXMT一直专注于DDR4和DDR5生产，但其长期路线图明确指向HBM。该公司的技术路径涉及利用较旧的深紫外（DUV）光刻技术来生产先进内存，这一策略既是约束也是创新驱动力。通过采用多重图案化技术，CXMT可以在没有极紫外（EUV）光刻机的情况下实现有竞争力的密度，而EUV设备正受到出口管制。这笔30亿美元的交易很可能包括用于腾讯庞大服务器集群的常规DDR5，以及用于推理工作负载的早期HBM2e或定制HBM变体。

数据表：HBM性能与成本对比

| HBM代际 | 每堆叠最大带宽 | 每堆叠容量 | 典型用例 | 预估每GB成本（2024年） |
|---|---|---|---|---|
| HBM2e | 460 GB/s | 8 GB | NVIDIA A100, AMD MI250 | $15 - $20 |
| HBM3 | 819 GB/s | 16 GB | NVIDIA H100, AMD MI300X | $25 - $35 |
| HBM3e | 1.2 TB/s | 24 GB | NVIDIA B200, AMD MI350 | $40 - $55 |
| CXMT（目标，2025年） | ~300 GB/s（预估） | 8 GB | 推理，边缘AI | $8 - $12（预估） |

数据要点： 从HBM2e到HBM3e，每GB HBM的成本几乎翻了三倍，这既源于堆叠工艺的复杂性，也源于寡头定价。CXMT的入局，即便是在较低性能层级，也可能为推理级内存带来50-70%的成本削减，从根本上改变大规模部署AI的经济性。

关键参与者与案例研究

这起诉讼直接点名了存储“三巨头”，但真正的故事涉及它们的客户和挑战者。

三星、SK海力士、美光： 这三家公司长期享受着舒适的三寡头格局。SK海力士是当前HBM3市场的领导者，已从NVIDIA获得早期且规模庞大的订单。三星正积极提升其HBM3e产量，但面临良率挑战。总部位于美国的美光则大力押注HBM3e，并近期获得了可观的《芯片法案》资金。这起诉讼直接威胁到它们的定价权。如果诉讼成功，可能导致三倍损害赔偿，并迫使它们与微软、亚马逊和谷歌等超大规模云厂商重新谈判长期合同。

腾讯与长鑫存储： 这是最具爆炸性的组合。腾讯是全球最大的AI算力消费者之一，为其微信生态系统、游戏和云服务运行模型。通过与CXMT签署30亿美元协议，腾讯正在押注供应链韧性。这是对潜在未来制裁或价格操纵的直接对冲。对CXMT而言，这笔交易提供了规模化其HBM雄心所需的收入和验证。技术挑战巨大：CXMT必须证明自己能够大规模交付可靠、高良率的内存。该公司的GitHub存在感微乎其微，但其内部工程团队以逆向工程HBM架构而闻名，方法包括研究开源学术论文和拆解商业产品。

谷歌 vs. 元（Gemini算力限制）： 这是一个引人入胜的支线情节。谷歌以“算力限制”为由，决定禁止元使用其Gemini模型进行训练，这明确承认即使是最大的云提供商也正触及物理极限。它揭示了AI堆叠战争中的一个隐藏维度：算力分配。谷歌正在优先考虑自己的内部模型（如Gemini本身），而非外部合作伙伴。这是一个经典的“平台风险”场景。拥有自己大规模GPU集群的元，现在正被激励加速其自研芯片和模型战略。这一事件凸显了HBM供应紧张如何在整个AI生态系统中产生连锁反应——当内存成为瓶颈时，即使是最大的玩家也必须做出艰难的选择。

更广泛的行业影响

这些事件共同指向一个结论：AI基础设施战争已进入新阶段。价格操纵诉讼可能打破存储寡头的定价体系，为超大规模云厂商节省数十亿美元。中国HBM的突破则提供了供应链多元化的可能性，尽管在性能和可靠性上仍有差距。而谷歌对算力的限制则揭示了即使拥有最先进硬件，物理限制和战略优先级也在重塑合作与竞争。

对于投资者和从业者而言，关键信号是明确的：HBM不仅是技术组件，更是地缘政治和商业战略的支点。未来几年，我们可能会看到更多类似CXMT-Tencent的垂直整合交易，以及更多针对寡头定价的法律挑战。AI的算力战争，正从GPU的晶体管数量，转向内存堆叠的高度和供应链的韧性。

时间归档

延伸阅读

常见问题

这次公司发布“AI Memory Wars: Price-Fixing Suits, China's HBM Breakthrough, and the New Stack Control”主要讲了什么？

This week, the AI hardware landscape was rocked by two seemingly disparate but deeply connected events. First, a consolidated class-action lawsuit was filed in the United States ag…

从“CXMT HBM technology roadmap vs Samsung SK Hynix”看，这家公司的这次发布为什么值得关注？

The core of this story is High Bandwidth Memory (HBM), a specialized type of DRAM that is vertically stacked and connected through silicon vias (TSVs). Unlike traditional DDR memory, HBM provides an extraordinarily wide…

围绕“Tencent AI chip supply chain strategy 2025”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。