静默革命:电压调节成为AI算力的下一个关键瓶颈

May 2026
归档:May 2026
AI数据中心正面临一场电力危机,但解决方案并非简单地增加瓦数,而是更智能的电压输送。AINews深度报道:电压调节模块(VRM)如何成为AI芯片性能、能效与总拥有成本(TCO)的关键前沿。

构建更大规模AI模型的竞赛撞上了一堵少有人预见的墙:不是晶体管密度,而是供电精度。当AI处理器将核心电压降至1V以下,同时汲取数百安培电流时,毫伏级的波动就足以引发计算错误或热失控。这正推动一场静默而深刻的电压调节模块(VRM)架构革命。将电源转换尽可能靠近处理器的Voltage Regulator Down(VRD)方案已成为行业标准,它降低了阻抗并改善了瞬态响应。我们的分析表明,更智能的电压调节可直接将机架级总拥有成本(TCO)降低5-10%,同时支持更激进的电源门控和动态电压缩放,从而延续类似摩尔定律的增益。

技术深度解析

核心挑战看似简单:现代AI芯片,如NVIDIA的H100和B200,核心电压运行在0.7V至0.9V之间,峰值电流却超过1000A。电压(V)、电流(I)与功率(P = V × I)之间的关系意味着,即使1%的电压跌落(例如从0.8V降至0.792V)也会导致逻辑错误,而1%的过冲则会缩短晶体管寿命。传统多相降压转换器位于数厘米外的独立电路板上,会引入寄生电感和电阻,使得快速瞬态响应几乎不可能实现。

解决方案是Voltage Regulator Down(VRD)架构,它将稳压器直接置于处理器基板或其紧邻位置。这可将供电网络(PDN)阻抗从毫欧级降至微欧级,实现亚微秒级的电流瞬态响应。行业正朝着两种互补方向发展:

1. GaN功率级:氮化镓(GaN)场效应晶体管(FET)相比传统硅MOSFET,具有显著更低的栅极电荷和输出电容。这使得开关频率可超过1MHz,而硅器件通常为300-600kHz,从而大幅缩小无源元件(电感、电容)的尺寸并改善瞬态响应。Navitas Semiconductor和EPC(Efficient Power Conversion)等公司已开发出基于GaN的功率IC,将驱动器和FET集成于单一封装,在高频下实现超过98%的效率。

2. 集成稳压器(IVR):VRD的终极形态是将稳压器直接嵌入芯片封装甚至芯片裸片上。Intel的Fully Integrated Voltage Regulator(FIVR)于2013年随Haswell架构推出,将多个电压调节器置于CPU封装上,实现了每核独立电压控制。对于AI芯片,这一方案正借助2.5D和3D堆叠等先进封装技术重新兴起。例如,MIT与Analog Devices近期发表的一篇论文展示了一种48V转1V的直接转换IVR,采用开关电容架构,峰值效率达93%,完全省去了中间的12V总线。

数据表格:供电架构对比

| 参数 | 传统多相降压 | GaN基VRD | 集成稳压器(IVR) |
|---|---|---|---|
| 开关频率 | 300-600 kHz | 1-3 MHz | 10-100 MHz |
| 满载效率 | 85-90% | 95-98% | 88-93% |
| 瞬态响应(0-100%负载阶跃) | 10-50 µs | 1-5 µs | < 1 µs |
| PDN阻抗(1 MHz时) | 1-5 mΩ | 0.1-0.5 mΩ | < 0.1 mΩ |
| 元件数量(每路) | 10-20个无源件 | 4-8个无源件 | 0个外部无源件 |
| 每安培成本 | $0.10-0.20 | $0.30-0.50 | $0.50-1.00 |
| 成熟度 | 成熟 | 早期采用 | 研发/小众 |

数据要点:对于当前AI工作负载,GaN基VRD在效率、瞬态响应和成本之间提供了最佳平衡;而IVR虽承诺终极性能,但成本过高,尚无法大规模部署。GaN带来的5-10%效率提升可直接转化为冷却成本降低和每机架计算密度提升。

一个关键的开源参考点是Open Compute Project(OCP)Power Delivery规范,它定义了数据中心VRM的标准外形尺寸。OCP的Open Rack V3标准包含48V总线架构,简化了VRD实现。在GitHub上,OCP-Power仓库(拥有超过1200颗星)提供了48V转1V GaN基VRM的参考设计,包括PCB布局和控制固件。这种社区驱动的方法通过降低设计风险加速了技术采用。

关键玩家与案例研究

VRM革命由老牌半导体巨头和敏捷初创公司共同推动。以下是关键参与者:

- Navitas Semiconductor:数据中心GaN功率IC领域的领导者。其GaNFast功率IC将驱动器、FET和保护电路集成于单一封装。Navitas已与Delta Electronics合作,为AI机架生产3kW和6kW电源,效率达98%。该公司于2021年通过SPAC上市,市值约50亿美元。

- Infineon Technologies:硅基电源管理领域的传统巨头。Infineon的CoolGaN和OptiMOS产品线直接与Navitas竞争。其优势在于垂直整合——自行生产GaN-on-Si晶圆,并与Dell、HPE等服务器OEM厂商保持深厚关系。

- Monolithic Power Systems(MPS):专注于AI加速器的高密度电源模块。其Intelli-Phase技术将电感和电容集成到模块中,使PCB面积减少40%。MPS为NVIDIA的HGX基板提供VRM。

- 初创公司
- Efficient Power Conversion(EPC):专注于低压应用的GaN FET。其EPC2302器件在3mm x 5mm封装内实现1.2 mΩ导通电阻,非常适合VRD。
- Vicor Corp

时间归档

May 20262737 篇已发布文章

延伸阅读

资本海啸:VC为何疯狂押注AI模型初创公司AI模型初创公司的大门正被挥舞着支票簿的投资者挤破。这并非单纯的炒作,而是一场针对错失下一轮范式转换的系统性对冲。AINews深度解析这场资本海啸背后的技术竞赛,以及当音乐停止时会发生什么。Token消耗飙升370倍:AI贵族阶层的崛起五大AI平台的Token消耗量在五年内暴涨370倍,揭示了一场从软件销售到算力租赁的静默权力转移。本文深度剖析这一自我强化的飞轮效应——它如何将资本与人才集中于顶层,并警告:视频生成与世界模型正在缔造一个只有少数玩家负担得起的“Token贵Token稀缺:重塑AI经济未来的隐性危机全球AI行业正面临前所未有的“Token饥荒”——AI推理的基础货币正在变得稀缺。随着模型规模膨胀、上下文窗口拉长、自主智能体激增,Token消耗速度远超效率提升。这不仅是成本问题,更是一场将重新定义智能定价与交付方式的结构性变革。从语音管道到AI银行:中国电信巨头押注算力代币化中国三大国有电信运营商正实施一场激进转型:从售卖语音分钟和数据流量,转向将GPU集群代币化为可交易的“算力代币”。AINews深度剖析这一“第三次生命”变革的技术架构、战略布局与市场影响。

常见问题

这篇关于“The Silent Revolution: Voltage Regulation Becomes AI's Next Critical Bottleneck”的文章讲了什么?

The race to build ever-larger AI models has hit a wall that few anticipated: not transistor density, but the precision of power delivery. As AI processors push core voltages below…

从“How GaN power stages improve AI chip performance”看,这件事为什么值得关注?

The core challenge is deceptively simple: modern AI chips, such as NVIDIA's H100 and B200, operate at core voltages around 0.7V to 0.9V while drawing peak currents exceeding 1000A. The relationship between voltage (V), c…

如果想继续追踪“AI data center power delivery architecture 2025”,应该重点看什么?

可以继续查看本文整理的原文链接、相关文章和 AI 分析部分,快速了解事件背景、影响与后续进展。