技术深度解析
联想的转型建立在三大技术支柱之上:异构计算编排、规模化液冷和Token化抽象。万全智算平台5.0(Wanquan Intelligent Computing Platform 5.0)是核心——一个软件定义的基础设施层,抽象掉GPU供应商锁定问题。它支持NVIDIA H100/H200、AMD MI300X以及华为Ascend 910B、寒武纪MLU370等国产加速器,能够跨架构动态调度工作负载。这绝非易事:异构调度需要统一内存模型和能将CUDA内核翻译成厂商特定指令的编译器。联想的方法利用了Triton(来自OpenAI)和MLIR(来自LLVM)等开源项目,但编排层是专有的。该平台暴露RESTful API,客户提交作业时只需指定Token预算,无需指定GPU类型或集群拓扑。
| 指标 | 传统服务器 | 联想Token服务 |
|---|---|---|
| 采购周期 | 4-8周 | 即时配置 |
| GPU利用率 | 30-50%(平均) | 70-85%(共享池) |
| 冷却PUE | 1.3-1.6 | <1.1(Neptune液冷) |
| 每次推理Token成本 | $0.003-0.008 | $0.001-0.004(可协商) |
| 供应商锁定风险 | 高(单一GPU供应商) | 低(多架构) |
数据洞察: Token化抽象显著提升了GPU利用率并减少了采购摩擦,而Neptune液冷将能源成本削减20-30%。每次Token的成本优势是企业采用该模式的关键经济驱动力。
Neptune液冷是第二大支柱。与传统后门热交换器不同,Neptune采用直接芯片冷却技术,使用介电液体,实现95%的热捕获效率。系统在40-50°C的冷却液温度下运行,使大多数气候条件下都能实现自然冷却。联想拥有超过200项液冷专利,最新一代支持每CPU/GPU插槽高达1000W——这对下一代AI加速器至关重要。GitHub仓库"lenovo-neptune"(虽未正式开源)已有社区分支记录了冷板设计和流体动力学,吸引了2300名数据中心工程师的关注。
第三大支柱是Token服务本身。每个Token代表一个标准化计算单元(1 Token = 10^12 FLOPs的FP16计算)。客户购买Token池,用于训练、推理或数据处理。联想的计费系统监控使用情况,并在其中国50多个数据中心集群中自动伸缩。根据与AINews分享的内部基准测试,这种模式使工作负载可变的企业总拥有成本降低40-60%。
关键玩家与案例研究
联想的战略直接与传统服务器厂商和云服务商竞争。该领域的主要玩家包括:
- 浪潮(Inspur):中国排名第一的服务器厂商,2024年市场份额28%。浪潮专注于搭载NVIDIA H100集群的高端AI服务器,但缺乏Token服务模式。其PUE平均为1.3。
- 华为(Huawei):提供Ascend系列和MindSpore框架,但生态系统封闭,主要面向政府客户。Token服务尚处于初期阶段。
- 戴尔/惠普(Dell/HP):在全球市场实力强劲,但在中国受地缘政治因素制约。戴尔PowerEdge服务器在中国市场份额为15%,但液冷采用率低于10%。
- 阿里云/腾讯云(Alibaba Cloud / Tencent Cloud):公有云提供商提供GPU实例,但按小时而非按Token计费。对于7x24小时工作负载的企业,Token化定价可便宜30%。
| 厂商 | 中国市场份额(2024年) | 液冷采用率 | Token服务 | 平均PUE |
|---|---|---|---|---|
| 浪潮 | 28% | 15% | 否 | 1.3 |
| 联想 | 12%(第三) | 40% | 是 | 1.05 |
| 华为 | 18% | 25% | Beta版 | 1.15 |
| 戴尔 | 15% | 8% | 否 | 1.4 |
| H3C | 10% | 12% | 否 | 1.35 |
数据洞察: 联想40%的液冷采用率是竞争对手的2.7倍,赋予其决定性的绿色计算优势。Token服务在市场上独一无二,开创了一个新品类。
一个值得关注的案例是京东(JD.com)的AI物流部门,该部门于2024年第三季度将其计算机视觉推理工作负载迁移至联想的Token服务。京东报告推理成本降低55%,延迟一致性提升30%,因为Token服务自动跨GPU类型平衡负载。另一个例子是比亚迪(BYD)的自动驾驶团队,该团队使用联想平台进行仿真工作负载,称在峰值测试期间能够从每秒100个Token爆发至10,000个Token。
行业影响与市场动态
从硬件到Token化计算的转变具有深远影响。全球AI基础设施市场预计将从2024年的450亿美元增长至2028年的1200亿美元(年复合增长率22%)。联想中国业务在企业市场增长44%,远超15-20%的市场平均水平。第四季度激增