技术深度解析
向模块化芯片设计的转变,本质上是对登纳德缩放定律失效以及摩尔定律红利终结的架构性回应。随着晶体管密度提升放缓,性能增益如今来自专用化。AI工作负载——矩阵乘法、注意力机制、卷积运算——需要高度并行、数据流优化的架构,这与通用CPU截然不同。这正是半导体IP大放异彩之处。
这场革命的核心是几个关键IP类别:
- 神经网络处理单元(NPU)核心:这些是专为张量运算设计的加速器。Arm(凭借其Ethos系列)、Cadence(凭借Tensilica)以及开源替代方案(如Google基于TPU的IP,虽未商业授权)提供预先设计、经过硅验证的NPU模块。例如,最新的Ethos-U85能效高达4 TOPS/瓦,针对边缘端的Transformer模型进行了优化。
- 高带宽内存(HBM)控制器与PHY:AI芯片受限于内存带宽。HBM3及即将推出的HBM4需要复杂的控制器和物理层(PHY)IP来管理DRAM芯片堆叠。Synopsys和Rambus主导这一领域,其HBM3 PHY IP每引脚数据速率高达8.4 Gbps,使每个堆叠的总带宽超过1 TB/s。
- 小芯片互连(UCIe, BoW):行业正转向通过先进封装连接的分解式芯片——小芯片。由Intel、AMD、Arm等支持的通用小芯片互连标准(UCIe)定义了物理层、芯片间适配器和协议栈。Alphawave Semi和OpenFive(现属SiFive)等IP供应商提供符合UCIe标准的芯片间IP,实现了来自不同代工厂的逻辑、内存和模拟小芯片的异构集成。
- 高速SerDes与PCIe:芯片与加速器之间的数据传输需要极速的串行器/解串器(SerDes)。数据速率为64 GT/s的PCIe Gen 6对于连接GPU和AI加速器至关重要。Synopsys和Cadence提供PCIe 6.0 IP,具备高级均衡和前向纠错(FEC)功能,以在损耗信道上维持信号完整性。
一个值得注意的开源项目是OpenROAD(GitHub: The-OpenROAD-Project/OpenROAD),它提供了从RTL到GDSII的自动化流程。虽然它本身不是IP核心,但降低了将第三方IP集成到定制设计中的门槛。该项目已获得超过1500颗星,被大学和初创公司用于原型设计AI加速器。
基准数据:下表比较了关键的AI加速器IP产品:
| IP核心 | 供应商 | 目标工作负载 | TOPS/瓦 (INT8) | 最高频率 | 工艺节点 | 授权模式 |
|---|---|---|---|---|---|---|
| Ethos-U85 | Arm | 边缘AI(Transformer, CNN) | 4.0 | 1 GHz | 16nm/12nm | 按单元 + 版税 |
| Tensilica DNA 100 | Cadence | 视觉、音频、AI | 2.5 | 800 MHz | 12nm/7nm | 按项目 + 版税 |
| NPU IP (Ncore) | Synopsys | 数据中心、边缘 | 3.2 | 1.2 GHz | 7nm/5nm | 订阅 + 版税 |
| RISC-V Vector (X280) | SiFive | 通用AI、DSP | 1.8 | 1.5 GHz | 7nm/5nm | 按核心 + 版税 |
数据要点:Arm的Ethos-U85在边缘AI能效方面领先,而Synopsys的Ncore则针对数据中心工作负载追求更高性能。授权模式正趋于经常性收入流,降低了芯片初创企业的前期成本。
关键玩家与案例研究
半导体IP生态系统由几家老牌巨头主导,但一波初创公司和开源倡议正在挑战现状。
Arm Holdings:CPU IP领域无可争议的领导者,其架构驱动着超过99%的智能手机,并迅速扩展到服务器(Ampere Computing、AWS Graviton)和AI加速器。Arm的Total Access授权模式允许客户以固定年费无限制访问其IP组合,这是锁定Apple、Qualcomm和NVIDIA等大客户的战略举措。然而,Arm近期就Nuvia定制CPU核心对Qualcomm提起的诉讼,凸显了IP授权与客户创新之间的紧张关系。
SiFive:RISC-V处理器IP的领先商业供应商。RISC-V的开源指令集架构(ISA)为Arm提供了引人注目的替代方案,尤其是在AI工作负载中,可以添加自定义指令而无需支付版税。SiFive的Intelligence系列(包括X280和P670)具备针对矩阵运算优化的向量扩展。该公司已从Intel和Qualcomm等投资者处筹集超过3.5亿美元。一个值得注意的案例是Tenstorrent,它使用SiFive的RISC-V核心作为其AI加速器中的控制处理器,展示了异构RISC-V加定制加速器设计的可行性。
Synopsys:按收入计算最大的EDA和IP供应商。其IP组合涵盖接口(USB、PCIe、DDR、HBM)、安全和模拟/混合信号IP。Synopsys的DesignWare IP系列包括用于AI的Ncore NPU、用于数据移动的HBM3/PCIe 6.0 PHY,以及用于功能安全的ARC处理器。其IP授权模式正转向基于订阅的经常性收入,为客户提供可预测的成本结构。Synopsys还提供系统级解决方案,将IP与EDA工具和验证服务捆绑,缩短从IP选择到芯片流片的时间。