电信巨头开卖算力Token:AI正式迈入“水电”时代

June 2026
AI infrastructure归档:June 2026
中国三大电信运营商正式推出标准化“算力Token”业务,将GPU集群转化为按需付费的公共算力服务。这一举措大幅降低了中小团队获取高性能计算的门槛,更标志着AI产业正进入大规模商业化阶段——而掌握“卖铲子”话语权的,如今变成了电信运营商。

在重新定义人工智能经济格局的重大举措中,中国三大电信运营商——中国移动、中国联通和中国电信——已正式面向AI开发者推出“算力Token”销售业务。这些Token是一种标准化的数字商品,代表一定单位的计算能力,通常以GPU小时或浮点运算次数计量。开发者只需通过简单的在线界面即可购买Token,如同给手机充值一样便捷,随后便可兑换使用高性能GPU集群进行模型训练或推理任务。此举直接回应了AI算力需求飙升的现实——对于无力承担自建或租赁高昂前期成本的初创公司和独立研究者而言,算力已成为发展的瓶颈。运营商将自身成熟的计费体系与虚拟化调度技术相结合,使算力像水电一样即开即用,这不仅是商业模式创新,更预示着AI产业底层基础设施的深刻变革。

技术深度解析

算力Token模式绝非单纯的计费噱头,其背后需要一套精密的技术栈支撑。核心架构包含三个层级:资源抽象层、Token记账层与动态编排层。

资源抽象层: 运营商将异构GPU资源——包括NVIDIA H100、A100以及华为昇腾910B等国产替代方案——整合为统一资源池。每块GPU通过容器化技术(基于Kubernetes与GPU Operator插件)及自定义调度器实现虚拟化,屏蔽硬件细节。Token本身是一种可互换的单位,代表标准化的计算切片,通常等价于单块H100 GPU在定义利用率(例如80% GPU利用率)下运行一小时的算力。这种抽象至关重要,它让开发者编写代码时无需关心底层运行的是哪块物理GPU。开源项目Kubernetes GPU Operator(GitHub: NVIDIA/gpu-operator,4.2k星标)被广泛用于此目的,不过运营商已开发出支持多厂商硬件的专有扩展。

Token记账与计费: 这是电信运营商发挥专长的领域。它们将原有的计费与充值系统(最初为语音、短信和数据流量设计)改造后用于处理算力Token。每笔Token购买记录在分布式账本中(通常采用私有区块链以实现可审计性,但非强制),追踪所有权、有效期与使用情况。计费系统支持预付费、后付费和订阅模式,并具备实时计量能力。例如,中国移动的“移动云AI”平台采用分级Token定价体系:

| Token等级 | 单价(人民币) | 有效期 | 包含GPU小时数(H100等效) |
|---|---|---|---|
| 入门版 | 0.50元 | 30天 | 1小时 |
| 专业版 | 0.45元 | 90天 | 10小时(含优先队列) |
| 企业版 | 0.40元 | 180天 | 50小时(专属节点) |

*数据洞察:分级定价揭示了运营商通过批量折扣锁定高用量用户的策略,而有效期设置则制造紧迫感、促进Token流转——这是经典的电信运营手法。*

动态编排层: 中央调度器(基于Apache YuniKorn或定制Kubernetes调度器)将持有Token的用户匹配到可用GPU资源。它处理抢占、负载均衡和容错。对于延迟敏感的推理任务,系统使用独立的预留GPU池;对于训练任务,则使用共享池中的竞价实例。调度器还实现了“Token燃烧速率”机制:如果用户任务处于空闲状态(例如等待数据加载),Token消耗速度会减慢,避免浪费。这是一项重大的工程挑战,因为必须最大化GPU利用率才能使Token模式盈利。

关键开源仓库:
- vLLM(GitHub: vllm-project/vllm,35k星标):用于高吞吐量LLM推理;运营商将其集成以服务基于Token的推理请求。
- SkyPilot(GitHub: skypilot-org/skypilot,6.8k星标):跨多云运行任务的框架;部分运营商正在探索将其用于联邦Token交换。

技术要点在于:算力Token的可行性得益于虚拟化与调度技术的进步,但真正的创新在于计费集成——这是电信运营商比云服务商领先十年的领域。

关键玩家与案例研究

中国移动: 作为用户规模最大的运营商,中国移动于2025年初推出“移动云AI”平台。它同时提供用于训练(H100集群)和推理(通过边缘节点)的算力Token。典型案例是智谱AI,该公司使用移动的Token训练了一个专用法律大模型。智谱报告称,相比从阿里云租赁,成本降低了30%,但由于共享基础设施,延迟略高。中国移动的策略是将算力Token与5G网络服务捆绑,为边缘AI应用打造“网络+算力”组合包。

中国联通: 联通采取了不同路径,与商汤科技合作提供预训练模型推理Token。开发者购买的Token仅可兑换商汤的模型,这实际上在算力之上构建了一层模型即服务(MaaS)。这种垂直整合降低了开发者的复杂性,但限制了灵活性。联通的Token定价略高于移动,但包含模型优化支持。

中国电信: 电信聚焦于国产AI芯片生态。其算力Token可用于华为昇腾910B集群,单Token成本更低,但峰值性能也较低。各运营商Token价值对比:

| 运营商 | GPU类型 | 每小时Token成本(人民币) | 峰值TFLOPS(FP16) | 能效(TFLOPS/W) |
|---|---|---|---|---|
| 中国移动 | NVIDIA H100 | 0.50元 | 1979 | 0.45 |
| 中国联通 | NVIDIA H100(商汤优化) | 0.55元 | 1979 | 0.45 |
| 中国电信 | 华为昇腾910B | 0.35元 | 640 | 0.38 |

相关专题

AI infrastructure279 篇相关文章

时间归档

June 2026309 篇已发布文章

延伸阅读

静默转型:大模型不再面向用户,转而服务于AI智能体大语言模型正从聊天机器人蜕变为自主智能体的“中枢大脑”,统筹处理从旅行规划到代码生成等复杂现实任务。这标志着价值衡量标准从“输出质量”向“任务完成度”的根本性转变。黄仁勋点名Marvell:下一个万亿美元半导体巨头浮出水面英伟达CEO黄仁勋罕见公开力挺Marvell Technology,标志着AI基础设施的重心正从算力转向数据流动效率。当瓶颈从原始计算能力变为数据传输速度,Marvell在定制芯片和高速互联领域的深厚护城河,或使其成为下一个万亿美元级别的半Token饥荒:AI巨头为何开始配给算力、重写规则无限Token挥霍的时代已经终结。一场静默的革命正在AI实验室中蔓延——由于边际收益急剧递减的残酷经济学,各大科技公司正主动削减Token消耗。这并非预算紧缩,而是对智能构建与部署方式的根本性反思。字节跳动AI核心离职:豆包加速变现,Seed团队“自由王国”终结字节跳动Seed AI研究团队核心负责人顾全权已离职。AINews分析认为,这并非简单的人事变动,而是字节跳动旗舰AI产品豆包加速商业化战略的直接后果,标志着公司从探索转向创收的根本性战略转折。

常见问题

这次公司发布“Telecom Giants Sell Compute Tokens: AI Enters the Utility Era”主要讲了什么?

In a move that redefines the economics of artificial intelligence, China's three major telecom operators—China Mobile, China Unicom, and China Telecom—have officially launched a 'c…

从“compute token pricing comparison China Mobile vs Unicom vs Telecom”看,这家公司的这次发布为什么值得关注?

The compute token model is not merely a billing gimmick; it requires a sophisticated technical stack to function. At its core, the system involves three layers: resource abstraction, token accounting, and dynamic orchest…

围绕“how to buy compute tokens for AI training in China”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。