技术深度解析
光模块革命本质上是一个由工程学解决的物理学问题。其核心挑战在于:在集群中,数据在GPU之间的移动速度必须快于GPU的处理速度。对于NVIDIA的H100和B200集群,每块GPU所需的互连带宽在两代产品间已从400 Gbps跃升至1.6 Tbps。铜缆受限于3米以上距离的信号完整性,根本无法在不产生不可接受的功耗和延迟代价的情况下维持这些速度。
硅光子学(SiPh)应运而生。传统光模块使用分立元件:激光二极管、调制器、光电探测器和控制电子器件,每个元件都在不同的材料平台(InP、LiNbO3、SiGe)上制造。SiPh利用CMOS兼容的制造工艺,将这些元件集成到单个硅衬底上。这降低了成本、尺寸和功耗。关键突破在于微环谐振器调制器,它能够以低于100飞焦耳/比特的能耗实现每波长100 Gbps的速率——相比马赫-曾德尔调制器提升了10倍。
| 参数 | 传统分立模块 (400G) | 硅光子模块 (800G) | 共封装光学 (1.6T 原型) |
|---|---|---|---|
| 每端口功耗 | 12W | 7W | 4W |
| 最大传输距离 | 2km (SMF) | 10km (SMF) | 100m (MCF) |
| 每跳延迟 | 350ns | 150ns | 50ns |
| 带宽密度 | 1.6 Tbps/英寸 | 3.2 Tbps/英寸 | 12.8 Tbps/英寸 |
| 每Gbps成本 | $0.80 | $0.35 | $0.12 (估计) |
数据要点: 硅光子学在能效和带宽密度上相比传统模块实现了2倍提升,而共封装光学(CPO)有望在所有指标上实现4倍飞跃。每Gbps成本从0.80美元降至0.12美元,是推动大规模采用的经济驱动力。
一个关键的开源参考点是OpenLight平台(GitHub: openlight-photonics),它提供了设计集成激光器的SiPh电路的PDK——这是一个重大障碍,因为此前需要外部激光器。该仓库已获得2300颗星,并有15家公司的活跃贡献,表明社区正在推动光子学设计的民主化。
下一个前沿是共封装光学(CPO),即将光学引擎直接集成到GPU封装或中介层中。Broadcom于2025年底发布的51.2 Tbps CPO交换机,使用了32个各提供1.6 Tbps的光学引擎。这消除了可插拔模块接口,将信号损耗和功耗再降低30-50%。工程挑战在于热管理:激光器对温度敏感,而GPU热点可能超过100°C。采用微流冷却的先进热解决方案正在开发中,但其在大规模部署中的可靠性仍有待验证。
关键玩家与案例研究
光模块市场由少数几家积极转向AI的厂商主导。最引人注目的是Innolight(原中际旭创),它已成为1000%暴涨的典型代表。其基于SiPh的800G OSFP模块是NVIDIA H100集群的主要互连方案。Innolight的策略是:与超大规模云厂商(微软、Meta、谷歌)签订独家供应协议,并大力投资自动化制造,以实现60%的毛利率——这在传统光学领域闻所未闻。
| 公司 | 市值 (2024) | 12个月回报 | 关键产品 | 客户集中度 |
|---|---|---|---|---|
| Innolight | $1200亿 | +1,200% | 800G OSFP SiPh | 70% 来自NVIDIA/Meta |
| Coherent Corp. | $450亿 | +350% | 1.6T FR4 | 40% 来自超大规模云厂商 |
| Lumentum | $280亿 | +280% | VCSEL阵列 | 50% 来自苹果/亚马逊 |
| Cisco (通过Acacia) | $180亿 (光学部门) | +150% | CPO交换机 | 仅内部使用 |
数据要点: Innolight的1200%回报不仅关乎技术,更在于其作为NVIDIA下一代集群唯一合格供应商的战略定位。高客户集中度既是优势也是弱点。
一个值得关注的案例是Marvell Technology,它于2020年以100亿美元收购了Inphi。Inphi的电光平台(PAM4 DSP)成为400G和800G模块的支柱。Marvell最新的1.6T DSP Alaska C,将7nm DSP与SiPh调制器集成,实现了每端口8W的功耗——比竞争对手提升20%。其策略是将DSP作为芯片组出售给模块制造商,从而创造随产量增长的版税收入流。
在研究方面,加州大学圣塔芭芭拉分校的John Bowers教授(Aurrion创始人,后被Juniper收购)开创了III-V族激光器在硅上的异质集成。其团队近期在单芯片上演示的64通道DWDM激光器阵列(发表于《自然·光子学》,2025年),可能使每对光纤实现6.4 Tbps的速率,比当前WDM系统提升4倍。
行业影响与市场动态
据行业估计,光模块市场预计将从2024年的120亿美元增长到2028年的650亿美元。这一增长由三个结构性转变驱动:
1. 从铜缆到光纤,甚至到每个节点:随着GPU集群规模从数千个扩展到数万个,机架内和机架间的铜缆互连在物理上和经济上都变得不可行。光纤,特别是通过共封装光学,正在渗透到服务器机箱内部,取代最后一英寸的铜线。
2. 从可插拔到共封装:可插拔模块(如QSFP、OSFP)曾是标准,但它们引入了信号完整性和功耗瓶颈。CPO将光学引擎直接集成到交换机ASIC或GPU封装中,消除了这些瓶颈。这一转变类似于从独立显卡到集成显卡的演变,但规模更大。
3. 从专有到开放生态系统:历史上,光学互连由专有接口主导。OCP(开放计算项目)推动的OpenZR+ 和OSFP-XD等开放标准正在实现多供应商互操作性。这降低了进入壁垒,并加速了创新。
市场影响: 光模块的繁荣正在创造新的赢家和输家。传统铜缆供应商(如安费诺、泰科电子)面临需求下降,而光纤和光子学公司则经历前所未有的增长。然而,风险依然存在:过度依赖少数超大规模云厂商、CPO的可靠性问题,以及地缘政治紧张局势可能扰乱供应链。
编辑观点: 光模块的1000%飙升并非投机泡沫,而是AI基础设施根本性转变的早期信号。随着世界模型和视频生成器成为主流,对带宽的需求将呈指数级增长。投资于硅光子学和CPO的公司——尤其是那些拥有强大制造能力和多元化客户基础的公司——将在未来十年处于有利地位。然而,投资者应警惕估值泡沫和地缘政治风险。