Google 停售 Workspace AI Ultra:企业 AI 的成本危机还是战略转向?

Hacker News May 2026
来源:Hacker News归档:May 2026
Google 正式下架了其高价的 Gemini 驱动订阅层 Workspace AI Ultra。此举标志着从独立 AI 功能定价的撤退,转向将 AI 嵌入标准套餐——这无异于承认,企业客户不愿仅为 AI 支付溢价。

Google 于 2026 年 5 月 5 日通过 Google Admin 控制台确认,终止了 Workspace AI Ultra 服务。这项每月每用户 30 美元的附加服务,曾承诺在 Gmail、Docs、Sheets 和 Meet 中深度集成 Gemini,于 2025 年初高调推出,直接对标 Microsoft 365 Copilot,但始终未能达到 Google 预期的采用率。内部消息人士透露,Gemini Ultra 级别推理的每用户推理成本——尤其是长上下文文档分析、实时会议转录和多模态查询——远高于订阅价格所能支撑的水平。Google 实际上在每个活跃的 AI Ultra 用户身上都在亏钱。该公司现在计划将部分 AI 功能(如智能撰写、自动摘要)重新分配到标准套餐中,试图通过生态黏性而非高价订阅来推动 AI 普及。

技术深度剖析

Workspace AI Ultra 的崩塌,本质上是一个关于大语言模型推理残酷经济学的故事。为其提供动力的 Google Gemini Ultra 模型,采用混合专家(MoE)架构,估计拥有 1.5 万亿参数,但每个 token 仅激活其中一小部分。尽管 MoE 相比密集模型降低了每 token 的计算量,但服务企业级工作负载的成本——尤其是长上下文窗口(Gemini 1.5 Pro 支持高达 200 万 token)和多模态输入——仍然高得令人望而却步。

推理成本问题

对于典型的企业用户,AI Ultra 被设计用来处理:
- 实时邮件起草和智能撰写(低延迟、高并发)
- 跨 100 页以上 PDF 的文档摘要(高上下文、中等并发)
- 会议转录和行动项提取(多模态、实时)
- 电子表格公式生成和数据分析(结构化推理)

每项任务消耗的 GPU 计算资源各不相同。实时起草可能每次请求花费 0.001 美元,但一次长文档摘要的推理计算成本可能高达 0.10 至 0.50 美元,具体取决于上下文长度。在每月每用户 30 美元的上限下,一个每月处理 50 份长文档的用户,很容易超出订阅的成本分配。

| 工作负载类型 | 每次请求的平均推理成本 | 每用户每月频率 | Google 的月度成本 |
|---|---|---|---|
| 智能撰写(短文本) | $0.001 | 5,000 | $5.00 |
| 文档摘要(100 页) | $0.30 | 30 | $9.00 |
| 会议转录(1 小时) | $0.50 | 20 | $10.00 |
| 电子表格分析 | $0.05 | 100 | $5.00 |
| 总计 | | | $29.00 |

数据洞察: Google 在 AI Ultra 上的利润率极薄,对于重度用户甚至为负。表格显示,一个中等活跃度的用户已经消耗了几乎全部订阅成本的推理计算资源,没有留下任何空间用于研发、基础设施或利润。这解释了为什么 Google 会拔掉插头——单位经济模型不可持续。

开源替代方案

与此同时,开源模型正在迅速缩小差距。GitHub 仓库 llama.cpp(超过 70,000 星标)现已支持 Llama 3.1 405B 的量化版本,可在单块 A100 GPU 上运行,以极低的成本达到与 Gemini Pro 相当的摘要质量。另一个仓库 vllm(超过 45,000 星标)提供采用 PagedAttention 的生产级服务,可将内存开销降低高达 60%。企业越来越多地探索自托管方案,这可能进一步侵蚀高级 AI 订阅的价值主张。

关键要点: 技术挑战不在于模型能力,而在于大规模的成本高效交付。Google 的 MoE 架构很优雅,但如果没有硬件效率或模型蒸馏方面的显著改进,高级 AI 订阅将始终是亏损的引流产品。

关键玩家与案例研究

Google vs. Microsoft:企业 AI 战争

Microsoft 的 Copilot for Microsoft 365 定价为每月每用户 30 美元,面临着同样的根本成本挑战。然而,Microsoft 拥有两大优势:更大的安装基数(超过 4 亿 Microsoft 365 商业用户,而 Google Workspace 虽有 30 亿+免费用户,但付费商业用户仅约 1000 万),以及与 Azure AI 基础设施更深的集成。Microsoft 还受益于与 OpenAI 的独家合作,这使其能够提前获得前沿模型。

| 功能 | Google Workspace AI Ultra(已停售) | Microsoft 365 Copilot | Google Workspace(新捆绑版) |
|---|---|---|---|
| 价格 | 每月每用户 30 美元 | 每月每用户 30 美元 | 包含在 Business/Enterprise 套餐中 |
| 模型 | Gemini Ultra | GPT-4o / o1 | Gemini Pro(受限) |
| 上下文窗口 | 200 万 token | 12.8 万 token | 12.8 万 token |
| 会议转录 | 是 | 是 | 是(基础版) |
| 文档摘要 | 完整 | 完整 | 受限(1 页) |
| 电子表格 AI | 高级 | 高级 | 基础公式 |
| 实时翻译 | 是 | 是 | 否 |

数据洞察: Google 的新捆绑产品牺牲深度换取广度。通过免费提供基础 AI 功能,Google 希望将用户锁定在生态系统中,并在日后向上销售高级功能。但这一策略可能面临被视为“AI 精简版”的风险,与 Copilot 功能齐全的 offering 相比相形见绌。

案例研究:大型企业的两难困境

考虑一家拥有 50,000 名 Workspace 用户的跨国公司。在 AI Ultra 下,年成本为 1800 万美元。采用新的捆绑模式后,基础功能的成本降至零,但该公司失去了多文档推理和自定义 AI 代理等高级功能。CFO 很高兴,但运营主管却很沮丧。这种紧张局势正在数千个组织中上演。

关键要点: Google 押注企业会接受功能降级以换取成本节约。但如果 Microsoft 通过降低 Copilot 价格或提供免费套餐来回应,Google 的策略可能适得其反。

行业影响

Google 此举向整个企业 AI 市场发出了一个信号:纯 AI 附加服务的定价模式可能已经走到尽头。随着推理成本持续高企,而开源替代品不断成熟,科技巨头必须重新思考如何将 AI 变现。Google 选择将 AI 作为生态系统的免费增值功能,而 Microsoft 则可能被迫调整其定价策略。这场博弈的结果将决定未来几年企业 AI 的格局。

更多来自 Hacker News

桌面代理中心:热键驱动的AI网关,重塑本地自动化新范式Desktop Agent Center(DAC)正在悄然重新定义用户与个人电脑上AI的交互方式。它不再需要用户在不同浏览器标签页间切换,也不再需要手动在桌面应用和AI网页界面之间传输数据——DAC充当了一个本地编排层。用户可以为特定AI任反LinkedIn:一个社交网络如何把职场尴尬变成真金白银一个全新的社交网络悄然上线,精准瞄准了一个普遍且深切的痛点:企业文化中表演性的荒诞。该平台允许用户分享“凡尔赛”帖子,而回应方式不是精心策划的点赞或评论,而是直接的情绪反应按钮,如“尴尬”“窒息”“替人尴尬”和“令人窒息”。这并非技术上的奇GPT-5.5智商缩水:为何顶尖AI连简单指令都执行不了AINews发现,OpenAI最先进的推理模型GPT-5.5正出现一种日益严重的能力退化模式。多位开发者反映,尽管该模型在复杂逻辑推理和代码生成基准测试中表现出色,却明显丧失了遵循简单多步骤指令的能力。一位开发者描述了一个案例:GPT-5.查看来源专题页Hacker News 已收录 3037 篇文章

时间归档

May 2026787 篇已发布文章

延伸阅读

亚马逊内部的AI反抗:开发者如何迫使工具革命一场悄然发生在亚马逊内部的“反抗”运动,彻底改写了公司的AI开发工具政策。工程师们因对僵化的内部编码助手感到不满,秘密引入了Claude等第三方AI代理。这场“起义”迫使领导层放弃封闭策略,标志着向开发者赋权的AI治理模式的关键转变。从禁用工具到企业导师:OpenClaw如何重塑AI智能体训练范式企业AI战略正经历一场深刻变革。曾被视作部署风险过高的OpenClaw等框架,如今被改造为商业AI智能体的终极训练场。这一战略转折将潜在威胁转化为竞争优势,从根本上改变了稳健可靠的企业级AI开发模式。桌面代理中心:热键驱动的AI网关,重塑本地自动化新范式Desktop Agent Center 是一款开源、本地优先的AI网关工具,用户只需一个热键即可从ChatGPT、Gemini等网络服务触发AI任务,彻底告别手动复制粘贴。这款工具标志着AI从浏览器端向操作系统原生集成的关键转变,带来了更GPT-5.5智商缩水:为何顶尖AI连简单指令都执行不了OpenAI旗舰推理模型GPT-5.5正显现出一个令人不安的趋势:它能解高难度数学题,却无法遵循简单的多步骤指令。开发者报告称,该模型反复拒绝执行基础的UI导航任务,这对其在生产环境中的可靠性提出了严重质疑。

常见问题

这次模型发布“Google Kills Workspace AI Ultra: Cost Crisis or Strategic Pivot for Enterprise AI?”的核心内容是什么?

Google's decision to terminate Workspace AI Ultra—a $30-per-user-per-month add-on that promised deep Gemini integration across Gmail, Docs, Sheets, and Meet—was confirmed via the G…

从“Google Workspace AI Ultra discontinued what happens to my subscription”看,这个模型发布为什么重要?

The collapse of Workspace AI Ultra is, at its core, a story about the brutal economics of large language model inference. Google's Gemini Ultra model, which powered the service, is a Mixture-of-Experts (MoE) architecture…

围绕“Is Microsoft Copilot better than Google Gemini for business”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。