技术深度解析
AI资本军备竞赛的核心只有一个:算力。DeepSeek的70亿美元融资不仅仅是为了购买GPU——而是为了锁定从硅片到电力的整个技术栈。当前的核心技术瓶颈已不再是模型架构,而是半导体制造的物理极限和数据中心建设的现实约束。
GPU供应链的现实
Nvidia H100和B200 GPU是最受追捧的硬件,但其生产依赖于台积电的CoWoS(Chip-on-Wafer-on-Substrate)先进封装产能。这是一个物理限制:台积电每月只能生产有限数量的中介层。目前,CoWoS产能估计约为每月15万片晶圆,Nvidia占据了其中超过60%。任何新入局者(如DeepSeek)要么提前数年锁定产能分配,要么接受性能较低的替代方案。
存储:沉默的瓶颈
Arm CEO Rene Haas关于存储芯片短缺的警告常被忽视,但至关重要。训练大型模型需要海量数据湖——数PB级别的高带宽内存(HBM)和SSD。Nvidia H200和B200使用的HBM3e主要由三星和SK海力士生产。当前HBM年供应量估计为2-3亿GB,但仅AI训练的需求到2026年就可能超过5亿GB。这形成了二级瓶颈:即便拥有GPU,如果没有足够的HBM,也无法以足够快的速度向GPU输送数据。
算力成本基准对比
| 模型 | 参数规模 | 训练算力(FLOPs) | 预估GPU小时数(H100) | 按3美元/小时计算成本 |
|---|---|---|---|---|
| GPT-4(估) | 1.8T | 2.1e25 | 5000万 | 1.5亿美元 |
| DeepSeek-V2 | 236B | 1.2e24 | 300万 | 900万美元 |
| Llama 3 405B | 405B | 3.8e24 | 900万 | 2700万美元 |
| Gemini Ultra(估) | 1.5T | 1.5e25 | 3500万 | 1.05亿美元 |
数据要点: 训练一个前沿模型仅算力成本就需要1亿至2亿美元。DeepSeek的70亿美元并非过度——它勉强够训练两到三个GPT-4级别的模型并大规模部署。真正的成本在于推理,在模型整个生命周期内,推理成本可能是训练成本的10倍。
开源替代方案
在DeepSeek大规模融资的同时,开源社区也在并行推进。vllm(4.1万星标)和TensorRT-LLM(1.2万星标)等仓库可将推理吞吐量提升2-5倍,从而减少对GPU数量的需求。然而,这些优化无法克服内存带宽的物理限制。斯坦福大学Tri Dao的FlashAttention仓库(1.2万星标)已成为减少内存开销的标准方案,但它并不能消除对HBM的需求。
数据要点: 技术前沿正从模型架构转向系统级优化——如何最大化昂贵硬件的利用率。能够实现80%以上GPU利用率(行业平均为30-50%)的公司将拥有2倍的成本优势。
关键玩家与案例分析
DeepSeek:挑战者
由梁文锋创立的DeepSeek一直是中国AI领域的黑马。其DeepSeek-V2模型仅用236B参数和创新的混合专家(MoE)架构,就实现了与Llama 3 405B相媲美的性能。其关键创新是多头潜在注意力(MLA),可将KV缓存大小减少80%,大幅降低推理内存成本。然而,其70亿美元融资标志着从效率向规模的转变——他们现在需要建设基础设施,以训练和提供GPT-4级别的模型服务。
Alphabet:基础设施巨头
Alphabet 847.5亿美元的资本筹集规模前所未有。其TPU v5p芯片专为AI工作负载定制,在训练方面比Nvidia GPU具有30-40%的成本优势。他们正在建设功率容量超过1GW的数据中心,每个成本高达30-50亿美元。这是一场垂直整合的赌注:控制芯片、数据中心、电力和模型。其Gemini模型系列已经表明,拥有完整技术栈可以在性能上获得优势,尤其是在多模态任务中。
伯克希尔·哈撒韦:资本锚点
沃伦·巴菲特100亿美元的投资表明,AI基础设施现在被视为类似公用事业的资产。伯克希尔正在投资数据中心REITs和发电公司,而非直接投资模型公司。这是一场赌注:算力需求将像电力需求一样持久。其隐含逻辑是:AI将成为一种商品,赢家将是那些拥有管道而非水的人。
Arm:沉默的守门人
Arm的Rene Haas之所以警告存储问题,是因为Arm架构几乎用于每一个SSD控制器和HBM接口。如果存储芯片受限,整个AI管道都将被卡住。Arm正将其Neoverse服务器核心定位为AI推理中x86的低功耗替代方案,但真正的关键在于授权:每个存储控制器都需要一个Arm核心,这使他们在供应链中拥有杠杆。
AI基础设施支出对比
| 公司 | 2024年AI资本支出(估) |
|---|---|
| Alphabet | 847.5亿美元 |
| 微软 | 500亿美元+ |
| 亚马逊 | 400亿美元+ |
| Meta | 350亿美元+ |
| 伯克希尔·哈撒韦 | 100亿美元(部分) |