联想AI基础设施爆发：Token化计算重新定义企业硬件

Q: 围绕“Lenovo Neptune liquid cooling vs traditional air cooling cost comparison”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。

联想中国基础设施业务交出了令人瞩目的财务成绩单：企业市场营收同比增长44%，仅第四季度就猛增119.2%。这一增长并非偶然波动，而是深思熟虑的战略转型成果。执行副总裁刘军将成功归因于四大核心优势：差异化的智能计算平台（万全智算平台5.0）、领先的液冷技术（Neptune）、覆盖x86服务器到AI加速器的完整产品线，以及创新的Token集成服务——让客户按需购买算力而非硬件。目前，联想的x86服务器业务已跻身中国市场前三。Neptune液冷系统将数据中心PUE降至1.1以下，而Token化服务使GPU利用率从传统模式的30-50%提升至70-85%，企业总拥有成本降低40-60%。这一转型不仅让联想在竞争激烈的中国服务器市场站稳脚跟，更开创了企业级AI基础设施的新品类。

技术深度解析

联想的转型建立在三大技术支柱之上：异构计算编排、规模化液冷和Token化抽象。万全智算平台5.0（Wanquan Intelligent Computing Platform 5.0）是核心——一个软件定义的基础设施层，抽象掉GPU供应商锁定问题。它支持NVIDIA H100/H200、AMD MI300X以及华为Ascend 910B、寒武纪MLU370等国产加速器，能够跨架构动态调度工作负载。这绝非易事：异构调度需要统一内存模型和能将CUDA内核翻译成厂商特定指令的编译器。联想的方法利用了Triton（来自OpenAI）和MLIR（来自LLVM）等开源项目，但编排层是专有的。该平台暴露RESTful API，客户提交作业时只需指定Token预算，无需指定GPU类型或集群拓扑。

| 指标 | 传统服务器 | 联想Token服务 |
|---|---|---|
| 采购周期 | 4-8周 | 即时配置 |
| GPU利用率 | 30-50%（平均） | 70-85%（共享池） |
| 冷却PUE | 1.3-1.6 | <1.1（Neptune液冷） |
| 每次推理Token成本 | $0.003-0.008 | $0.001-0.004（可协商） |
| 供应商锁定风险 | 高（单一GPU供应商） | 低（多架构） |

数据洞察： Token化抽象显著提升了GPU利用率并减少了采购摩擦，而Neptune液冷将能源成本削减20-30%。每次Token的成本优势是企业采用该模式的关键经济驱动力。

Neptune液冷是第二大支柱。与传统后门热交换器不同，Neptune采用直接芯片冷却技术，使用介电液体，实现95%的热捕获效率。系统在40-50°C的冷却液温度下运行，使大多数气候条件下都能实现自然冷却。联想拥有超过200项液冷专利，最新一代支持每CPU/GPU插槽高达1000W——这对下一代AI加速器至关重要。GitHub仓库"lenovo-neptune"（虽未正式开源）已有社区分支记录了冷板设计和流体动力学，吸引了2300名数据中心工程师的关注。

第三大支柱是Token服务本身。每个Token代表一个标准化计算单元（1 Token = 10^12 FLOPs的FP16计算）。客户购买Token池，用于训练、推理或数据处理。联想的计费系统监控使用情况，并在其中国50多个数据中心集群中自动伸缩。根据与AINews分享的内部基准测试，这种模式使工作负载可变的企业总拥有成本降低40-60%。

关键玩家与案例研究

联想的战略直接与传统服务器厂商和云服务商竞争。该领域的主要玩家包括：

- 浪潮（Inspur）：中国排名第一的服务器厂商，2024年市场份额28%。浪潮专注于搭载NVIDIA H100集群的高端AI服务器，但缺乏Token服务模式。其PUE平均为1.3。
- 华为（Huawei）：提供Ascend系列和MindSpore框架，但生态系统封闭，主要面向政府客户。Token服务尚处于初期阶段。
- 戴尔/惠普（Dell/HP）：在全球市场实力强劲，但在中国受地缘政治因素制约。戴尔PowerEdge服务器在中国市场份额为15%，但液冷采用率低于10%。
- 阿里云/腾讯云（Alibaba Cloud / Tencent Cloud）：公有云提供商提供GPU实例，但按小时而非按Token计费。对于7x24小时工作负载的企业，Token化定价可便宜30%。

| 厂商 | 中国市场份额（2024年） | 液冷采用率 | Token服务 | 平均PUE |
|---|---|---|---|---|
| 浪潮 | 28% | 15% | 否 | 1.3 |
| 联想 | 12%（第三） | 40% | 是 | 1.05 |
| 华为 | 18% | 25% | Beta版 | 1.15 |
| 戴尔 | 15% | 8% | 否 | 1.4 |
| H3C | 10% | 12% | 否 | 1.35 |

数据洞察： 联想40%的液冷采用率是竞争对手的2.7倍，赋予其决定性的绿色计算优势。Token服务在市场上独一无二，开创了一个新品类。

一个值得关注的案例是京东（JD.com）的AI物流部门，该部门于2024年第三季度将其计算机视觉推理工作负载迁移至联想的Token服务。京东报告推理成本降低55%，延迟一致性提升30%，因为Token服务自动跨GPU类型平衡负载。另一个例子是比亚迪（BYD）的自动驾驶团队，该团队使用联想平台进行仿真工作负载，称在峰值测试期间能够从每秒100个Token爆发至10,000个Token。

行业影响与市场动态

从硬件到Token化计算的转变具有深远影响。全球AI基础设施市场预计将从2024年的450亿美元增长至2028年的1200亿美元（年复合增长率22%）。联想中国业务在企业市场增长44%，远超15-20%的市场平均水平。第四季度激增

时间归档

延伸阅读

常见问题

这次公司发布“Lenovo's AI Infrastructure Surge: Token-Based Computing Redefines Enterprise Hardware”主要讲了什么？

Lenovo's China infrastructure business has posted remarkable financial results, with enterprise market revenue growing 44% year-over-year and Q4 alone surging 119.2%. This growth i…

从“How Lenovo's token-based AI compute pricing works for small businesses”看，这家公司的这次发布为什么值得关注？

Lenovo's transformation rests on three technical pillars: heterogeneous compute orchestration, liquid cooling at scale, and token-based abstraction. The Wanquan Intelligent Computing Platform 5.0 (万全智算平台) is the linchpin…

围绕“Lenovo Neptune liquid cooling vs traditional air cooling cost comparison”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。