超越“计费令牌”:AI巨头如何从算力贩售转向价值创造

AI产业初期以文本生成边际成本为核心的“令牌狂欢”已触及天花板。领先的供应商正经历根本性转向:从销售通用算力,转变为提供深度集成、可衡量商业影响力的解决方案。这标志着商业AI部署步入关键成熟期。

大型语言模型基于生成文本“按令牌计费”的商业模式,正在经历一场深刻变革。最初竞相提供最廉价计算单元的模式,已与企业现实产生碰撞:企业需要的不是原始的文本生成,而是能解决具体问题、带来可量化回报的可靠、集成的智能。这一转变在整个竞争格局中清晰可见。OpenAI逐步转向更复杂的多模态API调用和企业定制解决方案;Anthropic专注于宪法AI和为受监管行业提供“安全即服务”;Google将Gemini深度集成至Workspace和Cloud生态系统——这些举措都标志着对纯粹令牌经济学的背离。其核心驱动力是客户对可衡量投资回报率的需求,迫使供应商从“计算供应商”转型为“价值共创伙伴”。行业竞争维度正从价格与吞吐量,扩展至垂直整合深度、系统可靠性、数据主权保障以及最终的业务成果交付能力。

技术深度解析

AI系统的技术架构正从单一、无状态的文本生成器,演变为为集成而设计的模块化、有状态且确定性的系统。核心转变是从无状态补全转向有状态智能体

从自回归采样到确定性规划: 早期LLM基于简单的下一个令牌预测和基于温度的采样运行,导致输出有创意但不可预测。新一代模型则融入了规划算法思维链验证。例如,OpenAI的o1模型系列(预览版)据称采用了搜索增强推理,模型在给出最终可验证答案前,会在内部探索多种推理路径。这增加了单令牌的计算成本,但极大提升了可靠性——企业愿意接受这种权衡。开源社区也紧随其后。SWE-agent GitHub仓库(已获超8.5k星标)提供了一个基准和框架,用于构建能通过将任务分解为精确、可执行步骤来自主完成软件工程任务的AI智能体,其强调正确性而非速度。

检索增强生成(RAG)成为基础设施,而非附加功能: RAG不再是一种边缘技术,而是企业部署的基础层。创新点在于检索器与生成器的紧密耦合。像LlamaIndex的高级查询引擎这样的系统,已超越简单的语义搜索,融入了分层索引、查询规划和后处理验证。性能衡量指标也从“检索召回率”转向端到端任务成功率

| 系统架构 | 核心指标(旧) | 核心指标(新) | 关键使能技术 |
|---|---|---|---|
| 无状态LLM API | 令牌/秒,困惑度 | 任务成功率,解决方案延迟 | 自回归Transformer |
| 智能体框架 | 单轮对话准确率 | 多轮目标完成率 | 规划算法(如思维树),记忆模块 |
| RAG系统 | 检索命中率@K | 业务查询解决准确率 | 混合搜索,重排序模型,验证层 |
| 微调模型 | 基准测试分数(如MMLU) | 领域特定精确率/召回率 | 低秩适应(LoRA),直接偏好优化(DPO) |

数据启示: 技术演进正从量化层面,从优化高效文本生成(令牌/秒)转向优化可靠任务完成(成功率)。这需要更复杂、多组件的架构,运行成本更高,但每计算单元能交付更高价值。

“模型路由器”与混合专家模型(MoE)的兴起: 为了平衡成本与能力,供应商正在部署智能路由系统。用户查询被分析并导向最具成本效益的模型——简单分类可能交给小型快速模型,而复杂分析则触发更大、更昂贵的模型。这是MoE在API层面的实际应用。Anthropic的Claude 3模型家族(Haiku, Sonnet, Opus)的定价和定位明确服务于这种分层使用。技术挑战在于构建一个元分类器,能以最小开销准确路由查询。

关键参与者与案例研究

主要参与者的战略转向生动诠释了价值创造论题。

OpenAI:从API商店到解决方案平台。 OpenAI的发展轨迹显示出清晰的演进路径。最初的GPT-3 API是纯粹的文本输入、文本输出服务。如今,其战略重点已转向Assistants API(持久线程、内置检索、函数调用)、GPTs(自定义、可操作的智能体)以及与Microsoft Copilot等深度合作伙伴关系。Copilot是基于价值集成的典范:它不是按令牌出售,而是作为生产力增强工具嵌入GitHub、Office和Windows。其价值主张是开发者速度或员工效率,而非文本生成。传闻中OpenAI正在探索与企业客户的收入分成模式,进一步印证了这一转变。

Anthropic:出售安全与主权。 Anthropic的全部主张都基于价值。其宪法AI框架不仅是一个研究项目,更是金融、医疗和政府等风险管控至关重要领域的核心产品差异化因素。Anthropic的竞争点不是最便宜,而是最可信、最可控。其长上下文窗口(20万令牌)和在检索方面的高Recall@K,是为深度分析冗长文档这一特定高价值企业用例设计的特性。其商业模式包括定制模型开发专属部署选项,已远超令牌销售范畴。

Google:发挥生态优势。 Google的优势在于无与伦比的集成深度。Gemini for Workspace直接将AI嵌入Gmail、Docs、Sheets等核心生产力工具中,其价值体现在无缝的工作流增强,而非孤立的AI调用。同样,通过Google Cloud Vertex AI平台,企业可以访问、微调和部署模型,并与其现有的数据和分析服务紧密结合。Google的战略是利用其庞大的生态系统,将AI作为其现有服务套件的“智能层”进行分发,从而创造难以复制的粘性价值。

延伸阅读

Kimi的IPO转向:资本密集度如何迫使AI理想主义直面规模化现实曾公开承诺保持私有的中国AI初创公司Kimi,完成了一次戏剧性的战略急转,正加速奔向IPO。这一逆转不仅是立场的后退,更是对生成式AI竞赛已进入资本密集型阶段的清醒认知——私人资金已无法支撑实现AGI雄心所需的算力、人才与基础设施军备竞赛。Kimi上市,AI估值新算术迎大考:从狂热叙事到代币经济学月之暗面旗下长文本AI助手Kimi即将启动IPO,这远非一家公司的亮相秀。它正成为席卷AI投资界一套全新且严苛估值框架——代币经济学——的关键压力测试。市场的最终裁决将揭示,在超长上下文窗口等领域的技术实力,能否转化为可持续且盈利的商业护城从Sora炫技到Seedance盈利:AI视频如何找到首个真实商业模式AI视频生成的叙事逻辑已发生根本性转变。当Sora等模型以技术奇观引发惊叹时,以Kling和Seedance为代表的新一代平台,正实现Sora未能达成的目标:一条清晰、可扩展的盈利路径。通过优化速度、成本与工作流集成,它们正为蓬勃发展的微短Kimi的拐点:当技术辉煌遭遇规模化现实月之暗面(Moonshot AI)旗下的Kimi Chat,曾以其突破性的20万+上下文窗口惊艳业界,如今却站在了危险的十字路口。模型的技术成就固然吸引了海量用户,但公司正面临一个更艰巨的挑战:如何将现象级产品转化为可规模化、经济上可持续的

常见问题

这次公司发布“Beyond Token Pricing: How AI Giants Are Shifting From Computation to Value Creation”主要讲了什么?

The foundational business model of large language models, built on charging per token of generated text, is undergoing a profound transformation. What began as a race to offer the…

从“OpenAI enterprise pricing model 2025”看,这家公司的这次发布为什么值得关注?

The technical architecture of AI systems is evolving from monolithic, stateless text generators to modular, stateful, and deterministic systems designed for integration. The core shift is from stateless completion to sta…

围绕“Anthropic vs Google Cloud AI for business value”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。