超越“计费令牌”：AI巨头如何从算力贩售转向价值创造

大型语言模型基于生成文本“按令牌计费”的商业模式，正在经历一场深刻变革。最初竞相提供最廉价计算单元的模式，已与企业现实产生碰撞：企业需要的不是原始的文本生成，而是能解决具体问题、带来可量化回报的可靠、集成的智能。这一转变在整个竞争格局中清晰可见。OpenAI逐步转向更复杂的多模态API调用和企业定制解决方案；Anthropic专注于宪法AI和为受监管行业提供“安全即服务”；Google将Gemini深度集成至Workspace和Cloud生态系统——这些举措都标志着对纯粹令牌经济学的背离。其核心驱动力是客户对可衡量投资回报率的需求，迫使供应商从“计算供应商”转型为“价值共创伙伴”。行业竞争维度正从价格与吞吐量，扩展至垂直整合深度、系统可靠性、数据主权保障以及最终的业务成果交付能力。

技术深度解析

AI系统的技术架构正从单一、无状态的文本生成器，演变为为集成而设计的模块化、有状态且确定性的系统。核心转变是从无状态补全转向有状态智能体。

从自回归采样到确定性规划： 早期LLM基于简单的下一个令牌预测和基于温度的采样运行，导致输出有创意但不可预测。新一代模型则融入了规划算法和思维链验证。例如，OpenAI的o1模型系列（预览版）据称采用了搜索增强推理，模型在给出最终可验证答案前，会在内部探索多种推理路径。这增加了单令牌的计算成本，但极大提升了可靠性——企业愿意接受这种权衡。开源社区也紧随其后。SWE-agent GitHub仓库（已获超8.5k星标）提供了一个基准和框架，用于构建能通过将任务分解为精确、可执行步骤来自主完成软件工程任务的AI智能体，其强调正确性而非速度。

检索增强生成（RAG）成为基础设施，而非附加功能： RAG不再是一种边缘技术，而是企业部署的基础层。创新点在于检索器与生成器的紧密耦合。像LlamaIndex的高级查询引擎这样的系统，已超越简单的语义搜索，融入了分层索引、查询规划和后处理验证。性能衡量指标也从“检索召回率”转向端到端任务成功率。

| 系统架构 | 核心指标（旧） | 核心指标（新） | 关键使能技术 |
|---|---|---|---|
| 无状态LLM API | 令牌/秒，困惑度 | 任务成功率，解决方案延迟 | 自回归Transformer |
| 智能体框架 | 单轮对话准确率 | 多轮目标完成率 | 规划算法（如思维树），记忆模块 |
| RAG系统 | 检索命中率@K | 业务查询解决准确率 | 混合搜索，重排序模型，验证层 |
| 微调模型 | 基准测试分数（如MMLU） | 领域特定精确率/召回率 | 低秩适应（LoRA），直接偏好优化（DPO） |

数据启示： 技术演进正从量化层面，从优化高效文本生成（令牌/秒）转向优化可靠任务完成（成功率）。这需要更复杂、多组件的架构，运行成本更高，但每计算单元能交付更高价值。

“模型路由器”与混合专家模型（MoE）的兴起： 为了平衡成本与能力，供应商正在部署智能路由系统。用户查询被分析并导向最具成本效益的模型——简单分类可能交给小型快速模型，而复杂分析则触发更大、更昂贵的模型。这是MoE在API层面的实际应用。Anthropic的Claude 3模型家族（Haiku, Sonnet, Opus）的定价和定位明确服务于这种分层使用。技术挑战在于构建一个元分类器，能以最小开销准确路由查询。

关键参与者与案例研究

主要参与者的战略转向生动诠释了价值创造论题。

OpenAI：从API商店到解决方案平台。 OpenAI的发展轨迹显示出清晰的演进路径。最初的GPT-3 API是纯粹的文本输入、文本输出服务。如今，其战略重点已转向Assistants API（持久线程、内置检索、函数调用）、GPTs（自定义、可操作的智能体）以及与Microsoft Copilot等深度合作伙伴关系。Copilot是基于价值集成的典范：它不是按令牌出售，而是作为生产力增强工具嵌入GitHub、Office和Windows。其价值主张是开发者速度或员工效率，而非文本生成。传闻中OpenAI正在探索与企业客户的收入分成模式，进一步印证了这一转变。

Anthropic：出售安全与主权。 Anthropic的全部主张都基于价值。其宪法AI框架不仅是一个研究项目，更是金融、医疗和政府等风险管控至关重要领域的核心产品差异化因素。Anthropic的竞争点不是最便宜，而是最可信、最可控。其长上下文窗口（20万令牌）和在检索方面的高Recall@K，是为深度分析冗长文档这一特定高价值企业用例设计的特性。其商业模式包括定制模型开发和专属部署选项，已远超令牌销售范畴。

Google：发挥生态优势。 Google的优势在于无与伦比的集成深度。Gemini for Workspace直接将AI嵌入Gmail、Docs、Sheets等核心生产力工具中，其价值体现在无缝的工作流增强，而非孤立的AI调用。同样，通过Google Cloud Vertex AI平台，企业可以访问、微调和部署模型，并与其现有的数据和分析服务紧密结合。Google的战略是利用其庞大的生态系统，将AI作为其现有服务套件的“智能层”进行分发，从而创造难以复制的粘性价值。

延伸阅读

常见问题

这次公司发布“Beyond Token Pricing: How AI Giants Are Shifting From Computation to Value Creation”主要讲了什么？

The foundational business model of large language models, built on charging per token of generated text, is undergoing a profound transformation. What began as a race to offer the…

从“OpenAI enterprise pricing model 2025”看，这家公司的这次发布为什么值得关注？

The technical architecture of AI systems is evolving from monolithic, stateless text generators to modular, stateful, and deterministic systems designed for integration. The core shift is from stateless completion to sta…

围绕“Anthropic vs Google Cloud AI for business value”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。