联想AI基础设施爆发:Token化计算重新定义企业硬件

May 2026
归档:May 2026
联想中国基础设施业务上一财年实现两位数营收增长,企业市场销售额同比增长44%,第四季度更是飙升119.2%。公司正从硬件供应商转型为AI计算服务商,凭借差异化智能计算平台、先进液冷技术和Token化集成服务,重塑企业级计算格局。

联想中国基础设施业务交出了令人瞩目的财务成绩单:企业市场营收同比增长44%,仅第四季度就猛增119.2%。这一增长并非偶然波动,而是深思熟虑的战略转型成果。执行副总裁刘军将成功归因于四大核心优势:差异化的智能计算平台(万全智算平台5.0)、领先的液冷技术(Neptune)、覆盖x86服务器到AI加速器的完整产品线,以及创新的Token集成服务——让客户按需购买算力而非硬件。目前,联想的x86服务器业务已跻身中国市场前三。Neptune液冷系统将数据中心PUE降至1.1以下,而Token化服务使GPU利用率从传统模式的30-50%提升至70-85%,企业总拥有成本降低40-60%。这一转型不仅让联想在竞争激烈的中国服务器市场站稳脚跟,更开创了企业级AI基础设施的新品类。

技术深度解析

联想的转型建立在三大技术支柱之上:异构计算编排、规模化液冷和Token化抽象。万全智算平台5.0(Wanquan Intelligent Computing Platform 5.0)是核心——一个软件定义的基础设施层,抽象掉GPU供应商锁定问题。它支持NVIDIA H100/H200、AMD MI300X以及华为Ascend 910B、寒武纪MLU370等国产加速器,能够跨架构动态调度工作负载。这绝非易事:异构调度需要统一内存模型和能将CUDA内核翻译成厂商特定指令的编译器。联想的方法利用了Triton(来自OpenAI)和MLIR(来自LLVM)等开源项目,但编排层是专有的。该平台暴露RESTful API,客户提交作业时只需指定Token预算,无需指定GPU类型或集群拓扑。

| 指标 | 传统服务器 | 联想Token服务 |
|---|---|---|
| 采购周期 | 4-8周 | 即时配置 |
| GPU利用率 | 30-50%(平均) | 70-85%(共享池) |
| 冷却PUE | 1.3-1.6 | <1.1(Neptune液冷) |
| 每次推理Token成本 | $0.003-0.008 | $0.001-0.004(可协商) |
| 供应商锁定风险 | 高(单一GPU供应商) | 低(多架构) |

数据洞察: Token化抽象显著提升了GPU利用率并减少了采购摩擦,而Neptune液冷将能源成本削减20-30%。每次Token的成本优势是企业采用该模式的关键经济驱动力。

Neptune液冷是第二大支柱。与传统后门热交换器不同,Neptune采用直接芯片冷却技术,使用介电液体,实现95%的热捕获效率。系统在40-50°C的冷却液温度下运行,使大多数气候条件下都能实现自然冷却。联想拥有超过200项液冷专利,最新一代支持每CPU/GPU插槽高达1000W——这对下一代AI加速器至关重要。GitHub仓库"lenovo-neptune"(虽未正式开源)已有社区分支记录了冷板设计和流体动力学,吸引了2300名数据中心工程师的关注。

第三大支柱是Token服务本身。每个Token代表一个标准化计算单元(1 Token = 10^12 FLOPs的FP16计算)。客户购买Token池,用于训练、推理或数据处理。联想的计费系统监控使用情况,并在其中国50多个数据中心集群中自动伸缩。根据与AINews分享的内部基准测试,这种模式使工作负载可变的企业总拥有成本降低40-60%。

关键玩家与案例研究

联想的战略直接与传统服务器厂商和云服务商竞争。该领域的主要玩家包括:

- 浪潮(Inspur):中国排名第一的服务器厂商,2024年市场份额28%。浪潮专注于搭载NVIDIA H100集群的高端AI服务器,但缺乏Token服务模式。其PUE平均为1.3。
- 华为(Huawei):提供Ascend系列和MindSpore框架,但生态系统封闭,主要面向政府客户。Token服务尚处于初期阶段。
- 戴尔/惠普(Dell/HP):在全球市场实力强劲,但在中国受地缘政治因素制约。戴尔PowerEdge服务器在中国市场份额为15%,但液冷采用率低于10%。
- 阿里云/腾讯云(Alibaba Cloud / Tencent Cloud):公有云提供商提供GPU实例,但按小时而非按Token计费。对于7x24小时工作负载的企业,Token化定价可便宜30%。

| 厂商 | 中国市场份额(2024年) | 液冷采用率 | Token服务 | 平均PUE |
|---|---|---|---|---|
| 浪潮 | 28% | 15% | 否 | 1.3 |
| 联想 | 12%(第三) | 40% | 是 | 1.05 |
| 华为 | 18% | 25% | Beta版 | 1.15 |
| 戴尔 | 15% | 8% | 否 | 1.4 |
| H3C | 10% | 12% | 否 | 1.35 |

数据洞察: 联想40%的液冷采用率是竞争对手的2.7倍,赋予其决定性的绿色计算优势。Token服务在市场上独一无二,开创了一个新品类。

一个值得关注的案例是京东(JD.com)的AI物流部门,该部门于2024年第三季度将其计算机视觉推理工作负载迁移至联想的Token服务。京东报告推理成本降低55%,延迟一致性提升30%,因为Token服务自动跨GPU类型平衡负载。另一个例子是比亚迪(BYD)的自动驾驶团队,该团队使用联想平台进行仿真工作负载,称在峰值测试期间能够从每秒100个Token爆发至10,000个Token。

行业影响与市场动态

从硬件到Token化计算的转变具有深远影响。全球AI基础设施市场预计将从2024年的450亿美元增长至2028年的1200亿美元(年复合增长率22%)。联想中国业务在企业市场增长44%,远超15-20%的市场平均水平。第四季度激增

时间归档

May 20262491 篇已发布文章

延伸阅读

From Meituan Delivery Algorithms to Robotic Kitchens: AtomBite.AI's Vertical Embodied AI PlayAtomBite.AI, a two-month-old embodied intelligence startup founded by former Meituan delivery technology lead Dr. Wang D中国首个K-12人工智能安全基地:一场针对青少年网络防御者的战略布局北京八中与网安巨头奇安信联合揭幕了全国首个“青少年人工智能安全训练基地”,将AI安全教育从大学“补课”阶段下沉至K-12嵌入式学习。这一举措标志着国家人才战略的深刻转向——从培养使用者转向培养防御者。CVPR 2026:视频AI从像素生成转向物理世界模拟CVPR 2026标志着视频AI领域的范式转移:业界正放弃追求照片级帧序列,转而构建真正理解运动、物理和因果关系的模型。本文深入探讨轨迹编辑、3D几何约束与自适应分词技术如何将视频生成器转变为世界模拟器。算法效率取代GPU囤积:字节跳动CVPR 2026四篇论文重新定义AI未来字节跳动Seed团队在CVPR 2026上发表的四篇论文,标志着AI行业一次决定性的转向:算法效率,而非GPU数量,正成为新的竞争护城河。TEMF、Beyond Token Eviction、Mixture-of-Depths Attent

常见问题

这次公司发布“Lenovo's AI Infrastructure Surge: Token-Based Computing Redefines Enterprise Hardware”主要讲了什么?

Lenovo's China infrastructure business has posted remarkable financial results, with enterprise market revenue growing 44% year-over-year and Q4 alone surging 119.2%. This growth i…

从“How Lenovo's token-based AI compute pricing works for small businesses”看,这家公司的这次发布为什么值得关注?

Lenovo's transformation rests on three technical pillars: heterogeneous compute orchestration, liquid cooling at scale, and token-based abstraction. The Wanquan Intelligent Computing Platform 5.0 (万全智算平台) is the linchpin…

围绕“Lenovo Neptune liquid cooling vs traditional air cooling cost comparison”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。