Google 停售 Workspace AI Ultra:企业 AI 的成本危机还是战略转向?

Hacker News May 2026
来源:Hacker News归档:May 2026
Google 正式下架了其高价的 Gemini 驱动订阅层 Workspace AI Ultra。此举标志着从独立 AI 功能定价的撤退,转向将 AI 嵌入标准套餐——这无异于承认,企业客户不愿仅为 AI 支付溢价。

Google 于 2026 年 5 月 5 日通过 Google Admin 控制台确认,终止了 Workspace AI Ultra 服务。这项每月每用户 30 美元的附加服务,曾承诺在 Gmail、Docs、Sheets 和 Meet 中深度集成 Gemini,于 2025 年初高调推出,直接对标 Microsoft 365 Copilot,但始终未能达到 Google 预期的采用率。内部消息人士透露,Gemini Ultra 级别推理的每用户推理成本——尤其是长上下文文档分析、实时会议转录和多模态查询——远高于订阅价格所能支撑的水平。Google 实际上在每个活跃的 AI Ultra 用户身上都在亏钱。该公司现在计划将部分 AI 功能(如智能撰写、自动摘要)重新分配到标准套餐中,试图通过生态黏性而非高价订阅来推动 AI 普及。

技术深度剖析

Workspace AI Ultra 的崩塌,本质上是一个关于大语言模型推理残酷经济学的故事。为其提供动力的 Google Gemini Ultra 模型,采用混合专家(MoE)架构,估计拥有 1.5 万亿参数,但每个 token 仅激活其中一小部分。尽管 MoE 相比密集模型降低了每 token 的计算量,但服务企业级工作负载的成本——尤其是长上下文窗口(Gemini 1.5 Pro 支持高达 200 万 token)和多模态输入——仍然高得令人望而却步。

推理成本问题

对于典型的企业用户,AI Ultra 被设计用来处理:
- 实时邮件起草和智能撰写(低延迟、高并发)
- 跨 100 页以上 PDF 的文档摘要(高上下文、中等并发)
- 会议转录和行动项提取(多模态、实时)
- 电子表格公式生成和数据分析(结构化推理)

每项任务消耗的 GPU 计算资源各不相同。实时起草可能每次请求花费 0.001 美元,但一次长文档摘要的推理计算成本可能高达 0.10 至 0.50 美元,具体取决于上下文长度。在每月每用户 30 美元的上限下,一个每月处理 50 份长文档的用户,很容易超出订阅的成本分配。

| 工作负载类型 | 每次请求的平均推理成本 | 每用户每月频率 | Google 的月度成本 |
|---|---|---|---|
| 智能撰写(短文本) | $0.001 | 5,000 | $5.00 |
| 文档摘要(100 页) | $0.30 | 30 | $9.00 |
| 会议转录(1 小时) | $0.50 | 20 | $10.00 |
| 电子表格分析 | $0.05 | 100 | $5.00 |
| 总计 | | | $29.00 |

数据洞察: Google 在 AI Ultra 上的利润率极薄,对于重度用户甚至为负。表格显示,一个中等活跃度的用户已经消耗了几乎全部订阅成本的推理计算资源,没有留下任何空间用于研发、基础设施或利润。这解释了为什么 Google 会拔掉插头——单位经济模型不可持续。

开源替代方案

与此同时,开源模型正在迅速缩小差距。GitHub 仓库 llama.cpp(超过 70,000 星标)现已支持 Llama 3.1 405B 的量化版本,可在单块 A100 GPU 上运行,以极低的成本达到与 Gemini Pro 相当的摘要质量。另一个仓库 vllm(超过 45,000 星标)提供采用 PagedAttention 的生产级服务,可将内存开销降低高达 60%。企业越来越多地探索自托管方案,这可能进一步侵蚀高级 AI 订阅的价值主张。

关键要点: 技术挑战不在于模型能力,而在于大规模的成本高效交付。Google 的 MoE 架构很优雅,但如果没有硬件效率或模型蒸馏方面的显著改进,高级 AI 订阅将始终是亏损的引流产品。

关键玩家与案例研究

Google vs. Microsoft:企业 AI 战争

Microsoft 的 Copilot for Microsoft 365 定价为每月每用户 30 美元,面临着同样的根本成本挑战。然而,Microsoft 拥有两大优势:更大的安装基数(超过 4 亿 Microsoft 365 商业用户,而 Google Workspace 虽有 30 亿+免费用户,但付费商业用户仅约 1000 万),以及与 Azure AI 基础设施更深的集成。Microsoft 还受益于与 OpenAI 的独家合作,这使其能够提前获得前沿模型。

| 功能 | Google Workspace AI Ultra(已停售) | Microsoft 365 Copilot | Google Workspace(新捆绑版) |
|---|---|---|---|
| 价格 | 每月每用户 30 美元 | 每月每用户 30 美元 | 包含在 Business/Enterprise 套餐中 |
| 模型 | Gemini Ultra | GPT-4o / o1 | Gemini Pro(受限) |
| 上下文窗口 | 200 万 token | 12.8 万 token | 12.8 万 token |
| 会议转录 | 是 | 是 | 是(基础版) |
| 文档摘要 | 完整 | 完整 | 受限(1 页) |
| 电子表格 AI | 高级 | 高级 | 基础公式 |
| 实时翻译 | 是 | 是 | 否 |

数据洞察: Google 的新捆绑产品牺牲深度换取广度。通过免费提供基础 AI 功能,Google 希望将用户锁定在生态系统中,并在日后向上销售高级功能。但这一策略可能面临被视为“AI 精简版”的风险,与 Copilot 功能齐全的 offering 相比相形见绌。

案例研究:大型企业的两难困境

考虑一家拥有 50,000 名 Workspace 用户的跨国公司。在 AI Ultra 下,年成本为 1800 万美元。采用新的捆绑模式后,基础功能的成本降至零,但该公司失去了多文档推理和自定义 AI 代理等高级功能。CFO 很高兴,但运营主管却很沮丧。这种紧张局势正在数千个组织中上演。

关键要点: Google 押注企业会接受功能降级以换取成本节约。但如果 Microsoft 通过降低 Copilot 价格或提供免费套餐来回应,Google 的策略可能适得其反。

行业影响

Google 此举向整个企业 AI 市场发出了一个信号:纯 AI 附加服务的定价模式可能已经走到尽头。随着推理成本持续高企,而开源替代品不断成熟,科技巨头必须重新思考如何将 AI 变现。Google 选择将 AI 作为生态系统的免费增值功能,而 Microsoft 则可能被迫调整其定价策略。这场博弈的结果将决定未来几年企业 AI 的格局。

更多来自 Hacker News

Anthropic's ID Mandate: The Dawn of Tiered AI Access ControlAnthropic宣布自7月8日起,用户访问其部分高级AI功能需通过身份验证。这一举措从自愿安全承诺转向强制性访问控制,标志着AI行业在风险管理上迈出关键一步。AINews分析认为,此举将重塑用户隐私、企业合规与AI开放生态之间的平衡,可能两行代码砍掉四成成本:Tokoscope 让大模型 Token 压缩自动化无节制 AI 开支的时代或许正在终结。AINews 获悉,Tokoscope 是一款轻量级中间件,可自动压缩大语言模型调用中的 Token 用量,早期测试显示成本降低高达 40%,且不牺牲输出质量。该工具仅需两行代码即可集成——一行包装 A本地LLM硬件计算器:架起AI软件与消费级硬件的桥梁“本地LLM硬件计算器”已成为开源AI生态系统中一个意想不到但至关重要的实用工具。其核心功能出奇地简单:用户输入自己的硬件规格——GPU型号、显存、系统内存和CPU——该工具便会将这些信息与Llama 3、Mistral、Qwen、Gemm查看来源专题页Hacker News 已收录 5011 篇文章

时间归档

May 20263028 篇已发布文章

延伸阅读

Token清算时刻:CFO们要求每一笔API调用都要有ROI随着企业AI支出失控,越来越多的CFO开始要求每一笔API调用都必须证明其投资回报率。我们的分析揭示了一场从“囤积Token”到“效率优先”的决定性转变,这场变革正在重塑整个AI商业模式。亚马逊内部的AI反抗:开发者如何迫使工具革命一场悄然发生在亚马逊内部的“反抗”运动,彻底改写了公司的AI开发工具政策。工程师们因对僵化的内部编码助手感到不满,秘密引入了Claude等第三方AI代理。这场“起义”迫使领导层放弃封闭策略,标志着向开发者赋权的AI治理模式的关键转变。从禁用工具到企业导师:OpenClaw如何重塑AI智能体训练范式企业AI战略正经历一场深刻变革。曾被视作部署风险过高的OpenClaw等框架,如今被改造为商业AI智能体的终极训练场。这一战略转折将潜在威胁转化为竞争优势,从根本上改变了稳健可靠的企业级AI开发模式。两行代码砍掉四成成本:Tokoscope 让大模型 Token 压缩自动化AINews 独家发现 Tokoscope——仅需两行代码即可自动压缩 LLM Token 用量并实时监控成本。它通过动态剔除冗余 Token 并展示实时成本仪表盘,直击大规模推理的隐性开支,有望让优化民主化,倒逼 API 提供商重新思考定

常见问题

这次模型发布“Google Kills Workspace AI Ultra: Cost Crisis or Strategic Pivot for Enterprise AI?”的核心内容是什么?

Google's decision to terminate Workspace AI Ultra—a $30-per-user-per-month add-on that promised deep Gemini integration across Gmail, Docs, Sheets, and Meet—was confirmed via the G…

从“Google Workspace AI Ultra discontinued what happens to my subscription”看,这个模型发布为什么重要?

The collapse of Workspace AI Ultra is, at its core, a story about the brutal economics of large language model inference. Google's Gemini Ultra model, which powered the service, is a Mixture-of-Experts (MoE) architecture…

围绕“Is Microsoft Copilot better than Google Gemini for business”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。