DeepSeek 70亿美元融资：AI竞赛从技术比拼升级为资本战争

AI行业已进入全新阶段，资本和供应链主导权的重要性超越了算法突破。DeepSeek以590亿美元估值完成70亿美元首轮融资，释放出一个清晰的信号：在基础模型领域追赶，需要天文数字般的投入用于GPU、人才和数据管道。Arm CEO Rene Haas关于存储芯片短缺的警告揭示了关键瓶颈——即便拥有无限资金，硬件供应也无法保证。与此同时，Alphabet计划筹集847.5亿美元，伯克希尔·哈撒韦投资100亿美元，表明科技巨头正将AI基础设施视为国家级战略优先事项。这已不再是技术竞赛，而是一场资本与供应链的战争。Nvidia CEO黄仁勋“Token即资产”的箴言正在成为现实，但真正的赢家将是那些能够掌控从芯片到电力整个链条的企业。

技术深度解析

AI资本军备竞赛的核心只有一个：算力。DeepSeek的70亿美元融资不仅仅是为了购买GPU——而是为了锁定从硅片到电力的整个技术栈。当前的核心技术瓶颈已不再是模型架构，而是半导体制造的物理极限和数据中心建设的现实约束。

GPU供应链的现实

Nvidia H100和B200 GPU是最受追捧的硬件，但其生产依赖于台积电的CoWoS（Chip-on-Wafer-on-Substrate）先进封装产能。这是一个物理限制：台积电每月只能生产有限数量的中介层。目前，CoWoS产能估计约为每月15万片晶圆，Nvidia占据了其中超过60%。任何新入局者（如DeepSeek）要么提前数年锁定产能分配，要么接受性能较低的替代方案。

存储：沉默的瓶颈

Arm CEO Rene Haas关于存储芯片短缺的警告常被忽视，但至关重要。训练大型模型需要海量数据湖——数PB级别的高带宽内存（HBM）和SSD。Nvidia H200和B200使用的HBM3e主要由三星和SK海力士生产。当前HBM年供应量估计为2-3亿GB，但仅AI训练的需求到2026年就可能超过5亿GB。这形成了二级瓶颈：即便拥有GPU，如果没有足够的HBM，也无法以足够快的速度向GPU输送数据。

算力成本基准对比

| 模型 | 参数规模 | 训练算力（FLOPs） | 预估GPU小时数（H100） | 按3美元/小时计算成本 |
|---|---|---|---|---|
| GPT-4（估） | 1.8T | 2.1e25 | 5000万 | 1.5亿美元 |
| DeepSeek-V2 | 236B | 1.2e24 | 300万 | 900万美元 |
| Llama 3 405B | 405B | 3.8e24 | 900万 | 2700万美元 |
| Gemini Ultra（估） | 1.5T | 1.5e25 | 3500万 | 1.05亿美元 |

数据要点： 训练一个前沿模型仅算力成本就需要1亿至2亿美元。DeepSeek的70亿美元并非过度——它勉强够训练两到三个GPT-4级别的模型并大规模部署。真正的成本在于推理，在模型整个生命周期内，推理成本可能是训练成本的10倍。

开源替代方案

在DeepSeek大规模融资的同时，开源社区也在并行推进。vllm（4.1万星标）和TensorRT-LLM（1.2万星标）等仓库可将推理吞吐量提升2-5倍，从而减少对GPU数量的需求。然而，这些优化无法克服内存带宽的物理限制。斯坦福大学Tri Dao的FlashAttention仓库（1.2万星标）已成为减少内存开销的标准方案，但它并不能消除对HBM的需求。

数据要点： 技术前沿正从模型架构转向系统级优化——如何最大化昂贵硬件的利用率。能够实现80%以上GPU利用率（行业平均为30-50%）的公司将拥有2倍的成本优势。

关键玩家与案例分析

DeepSeek：挑战者

由梁文锋创立的DeepSeek一直是中国AI领域的黑马。其DeepSeek-V2模型仅用236B参数和创新的混合专家（MoE）架构，就实现了与Llama 3 405B相媲美的性能。其关键创新是多头潜在注意力（MLA），可将KV缓存大小减少80%，大幅降低推理内存成本。然而，其70亿美元融资标志着从效率向规模的转变——他们现在需要建设基础设施，以训练和提供GPT-4级别的模型服务。

Alphabet：基础设施巨头

Alphabet 847.5亿美元的资本筹集规模前所未有。其TPU v5p芯片专为AI工作负载定制，在训练方面比Nvidia GPU具有30-40%的成本优势。他们正在建设功率容量超过1GW的数据中心，每个成本高达30-50亿美元。这是一场垂直整合的赌注：控制芯片、数据中心、电力和模型。其Gemini模型系列已经表明，拥有完整技术栈可以在性能上获得优势，尤其是在多模态任务中。

伯克希尔·哈撒韦：资本锚点

沃伦·巴菲特100亿美元的投资表明，AI基础设施现在被视为类似公用事业的资产。伯克希尔正在投资数据中心REITs和发电公司，而非直接投资模型公司。这是一场赌注：算力需求将像电力需求一样持久。其隐含逻辑是：AI将成为一种商品，赢家将是那些拥有管道而非水的人。

Arm：沉默的守门人

Arm的Rene Haas之所以警告存储问题，是因为Arm架构几乎用于每一个SSD控制器和HBM接口。如果存储芯片受限，整个AI管道都将被卡住。Arm正将其Neoverse服务器核心定位为AI推理中x86的低功耗替代方案，但真正的关键在于授权：每个存储控制器都需要一个Arm核心，这使他们在供应链中拥有杠杆。

AI基础设施支出对比

| 公司 | 2024年AI资本支出（估） |
|---|---|
| Alphabet | 847.5亿美元 |
| 微软 | 500亿美元+ |
| 亚马逊 | 400亿美元+ |
| Meta | 350亿美元+ |
| 伯克希尔·哈撒韦 | 100亿美元（部分） |

时间归档

延伸阅读

常见问题

这起“DeepSeek's $7B Raise Signals AI's Shift from Tech Race to Capital War”融资事件讲了什么？

The AI industry has entered a new phase where capital and supply chain dominance matter more than algorithmic breakthroughs. DeepSeek's $7 billion first round at a $59 billion valu…

从“How DeepSeek plans to spend $7 billion on AI compute”看，为什么这笔融资值得关注？

The AI capital arms race is fundamentally about one thing: compute. DeepSeek's $7 billion raise is not just about buying GPUs—it is about locking in the entire stack from silicon to power. The core technical bottleneck i…

这起融资事件在“Why Arm CEO warns of storage chip shortage for AI”上释放了什么行业信号？

它通常意味着该赛道正在进入资源加速集聚期，后续值得继续关注团队扩张、产品落地、商业化验证和同类公司跟进。