技术纵深
向“算力主权”的战略转向,本质上是一场规模与复杂性空前的工程学挑战。它将主战场从迭代迅速、资本需求相对较低的软件算法领域,转移到了物理、材料科学和能源物流的硬核领域。
TERAFAB级别的雄心,核心在于计算密度与系统集成度的飞跃。年化1太瓦(TW)的算力输出目标,若假设持续运行,意味着需要维持约114吉瓦(GW)的运营功耗。这并非建造单一数据中心,而是构建一个地理分布、功耗优化的算力工厂网络。其技术架构可能围绕以下几个关键支柱展开:
1. 基于Chiplet的异质集成:为绕过单一先进制程节点的限制,中国企业正积极布局Chiplet架构。这涉及使用成熟或次先进制程(如14nm-7nm)设计更小、功能化的芯片裸片(Chiplet),并通过2.5D/3D堆叠或硅中介层等先进封装技术进行集成。华为的昇腾910B AI加速器以及壁仞科技等公司均采用此类策略。开源框架Chipyard(一个RISC-V SoC设计环境)和OpenROAD项目(旨在实现全自动、无人干预的芯片设计)是推动这一转变的关键GitHub仓库。OpenROAD已获得显著关注(超过1.5k星标),因其承诺将芯片设计时间和成本降低数个数量级。
2. 液冷与供电系统:当机柜功率密度超过50kW时,风冷已无法胜任。直触式(D2C)冷却和浸没式冷却正成为必选项。这需要对服务器机柜、冷却分配单元(CDU)乃至芯片本身进行协同设计。供电网络(PDN)必须实现前所未有的效率,以避免在电力到达晶体管之前就以热量形式损耗10-15%的能源。
3. AI优化的数据中心互连架构:网络互连已成为新的瓶颈。尽管英伟达的InfiniBand技术占据主导,但开放替代方案正在涌现。开放计算项目(OCP) 对开放网络的贡献,以及由微软在GitHub上托管的SONiC(云开放网络软件)网络操作系统至关重要。SONiC实现了交换机硬件与软件的解耦,是降低成本、避免供应商锁定的关键策略。
| 算力基础设施层 | 核心挑战 | 中国战略路径 | 全球领先标杆 |
|---|---|---|---|
| 逻辑芯片 | 先进制程(<7nm)制造 | Chiplet设计、成熟制程优化、替代架构(RISC-V) | 台积电3nm/2nm GAA、英特尔18A |
| 存储芯片 | 高带宽内存(HBM) | 发展国产HBM(长鑫存储、长江存储),探索基于CXL的池化技术 | SK海力士HBM3E、三星 |
| 互连技术 | 低延迟、高带宽互连架构 | 部署RoCEv2,投资光I/O技术,参与SONiC/OCP贡献 | 英伟达NVLink/InfiniBand |
| 冷却系统 | 热通量 >1kW/cm² | 快速采用浸没式冷却,制定冷板标准 | GRC、LiquidStack、Submer |
| 电力系统 | 能效(PUE)、电网融合 | 选址靠近可再生能源(水电、风电),先进UPS/PDU设计 | 谷歌、微软目标PUE 1.1 |
数据洞察:上表揭示了一种多战线策略:在单一芯片前沿领域接受暂时落后,同时在系统集成与能效层(冷却、供电、网络)展开激烈竞争。成功的关键在于缩小在存储和互连领域的差距,同时充分利用系统级创新。
关键参与者与案例研究
资本转向正在重塑战略玩家的格局,从消费互联网巨头扩展到由工业制造商、专业芯片设计公司和国资背景实体组成的联盟。
TCL与华星半导体:TCL的举动是经典的纵向整合,但赋予了主权色彩。通过入股华星,TCL不仅确保了面板供应,更是投资于对显示驱动IC、Micro-LED巨量转移和先进封装至关重要的半导体工艺。这效仿了三星从材料到成品设备全栈控制的模式。TCL在电视和面板领域规模化制造与成本竞争的经验,正被应用于上游环节。
特斯拉与TERAFAB愿景:尽管特斯拉的主线叙事是汽车,但其Dojo超级计算机项目和TERAFAB的宣布,将其定位为一家纯粹的AI基础设施公司。特斯拉的优势在于其闭环数据飞轮(真实世界驾驶数据 -> 训练 -> 产品改进)以及大规模自动化制造的经验。TERAFAB正是这种能力的工业化放大。其核心赌注在于,能够建造并运营