技术深度剖析
Workspace AI Ultra 的崩塌,本质上是一个关于大语言模型推理残酷经济学的故事。为其提供动力的 Google Gemini Ultra 模型,采用混合专家(MoE)架构,估计拥有 1.5 万亿参数,但每个 token 仅激活其中一小部分。尽管 MoE 相比密集模型降低了每 token 的计算量,但服务企业级工作负载的成本——尤其是长上下文窗口(Gemini 1.5 Pro 支持高达 200 万 token)和多模态输入——仍然高得令人望而却步。
推理成本问题
对于典型的企业用户,AI Ultra 被设计用来处理:
- 实时邮件起草和智能撰写(低延迟、高并发)
- 跨 100 页以上 PDF 的文档摘要(高上下文、中等并发)
- 会议转录和行动项提取(多模态、实时)
- 电子表格公式生成和数据分析(结构化推理)
每项任务消耗的 GPU 计算资源各不相同。实时起草可能每次请求花费 0.001 美元,但一次长文档摘要的推理计算成本可能高达 0.10 至 0.50 美元,具体取决于上下文长度。在每月每用户 30 美元的上限下,一个每月处理 50 份长文档的用户,很容易超出订阅的成本分配。
| 工作负载类型 | 每次请求的平均推理成本 | 每用户每月频率 | Google 的月度成本 |
|---|---|---|---|
| 智能撰写(短文本) | $0.001 | 5,000 | $5.00 |
| 文档摘要(100 页) | $0.30 | 30 | $9.00 |
| 会议转录(1 小时) | $0.50 | 20 | $10.00 |
| 电子表格分析 | $0.05 | 100 | $5.00 |
| 总计 | | | $29.00 |
数据洞察: Google 在 AI Ultra 上的利润率极薄,对于重度用户甚至为负。表格显示,一个中等活跃度的用户已经消耗了几乎全部订阅成本的推理计算资源,没有留下任何空间用于研发、基础设施或利润。这解释了为什么 Google 会拔掉插头——单位经济模型不可持续。
开源替代方案
与此同时,开源模型正在迅速缩小差距。GitHub 仓库 llama.cpp(超过 70,000 星标)现已支持 Llama 3.1 405B 的量化版本,可在单块 A100 GPU 上运行,以极低的成本达到与 Gemini Pro 相当的摘要质量。另一个仓库 vllm(超过 45,000 星标)提供采用 PagedAttention 的生产级服务,可将内存开销降低高达 60%。企业越来越多地探索自托管方案,这可能进一步侵蚀高级 AI 订阅的价值主张。
关键要点: 技术挑战不在于模型能力,而在于大规模的成本高效交付。Google 的 MoE 架构很优雅,但如果没有硬件效率或模型蒸馏方面的显著改进,高级 AI 订阅将始终是亏损的引流产品。
关键玩家与案例研究
Google vs. Microsoft:企业 AI 战争
Microsoft 的 Copilot for Microsoft 365 定价为每月每用户 30 美元,面临着同样的根本成本挑战。然而,Microsoft 拥有两大优势:更大的安装基数(超过 4 亿 Microsoft 365 商业用户,而 Google Workspace 虽有 30 亿+免费用户,但付费商业用户仅约 1000 万),以及与 Azure AI 基础设施更深的集成。Microsoft 还受益于与 OpenAI 的独家合作,这使其能够提前获得前沿模型。
| 功能 | Google Workspace AI Ultra(已停售) | Microsoft 365 Copilot | Google Workspace(新捆绑版) |
|---|---|---|---|
| 价格 | 每月每用户 30 美元 | 每月每用户 30 美元 | 包含在 Business/Enterprise 套餐中 |
| 模型 | Gemini Ultra | GPT-4o / o1 | Gemini Pro(受限) |
| 上下文窗口 | 200 万 token | 12.8 万 token | 12.8 万 token |
| 会议转录 | 是 | 是 | 是(基础版) |
| 文档摘要 | 完整 | 完整 | 受限(1 页) |
| 电子表格 AI | 高级 | 高级 | 基础公式 |
| 实时翻译 | 是 | 是 | 否 |
数据洞察: Google 的新捆绑产品牺牲深度换取广度。通过免费提供基础 AI 功能,Google 希望将用户锁定在生态系统中,并在日后向上销售高级功能。但这一策略可能面临被视为“AI 精简版”的风险,与 Copilot 功能齐全的 offering 相比相形见绌。
案例研究:大型企业的两难困境
考虑一家拥有 50,000 名 Workspace 用户的跨国公司。在 AI Ultra 下,年成本为 1800 万美元。采用新的捆绑模式后,基础功能的成本降至零,但该公司失去了多文档推理和自定义 AI 代理等高级功能。CFO 很高兴,但运营主管却很沮丧。这种紧张局势正在数千个组织中上演。
关键要点: Google 押注企业会接受功能降级以换取成本节约。但如果 Microsoft 通过降低 Copilot 价格或提供免费套餐来回应,Google 的策略可能适得其反。
行业影响
Google 此举向整个企业 AI 市场发出了一个信号:纯 AI 附加服务的定价模式可能已经走到尽头。随着推理成本持续高企,而开源替代品不断成熟,科技巨头必须重新思考如何将 AI 变现。Google 选择将 AI 作为生态系统的免费增值功能,而 Microsoft 则可能被迫调整其定价策略。这场博弈的结果将决定未来几年企业 AI 的格局。