苹果押注谷歌Gemini:一场改变一切的务实AI转向

June 2026
归档:June 2026
苹果终于在WWDC26兑现了两年之久的Siri承诺,但真正的惊喜是升级背后的“大脑”:谷歌Gemini。这绝非简单的授权交易——它是一次战略性的承认,即苹果自有的大模型尚无法竞争,同时也为AI巨头们如何既合作又竞争绘制了蓝图。

在WWDC26上,苹果发布了期待已久的Siri全面革新,但业界震惊地发现,该助手复杂的推理能力如今运行在谷歌的Gemini模型上。这标志着苹果从历来封闭的生态系统做出了根本性转变,也务实承认其自有的大语言模型虽然在设备端以隐私见长,但在多轮对话、代码生成和复杂推理方面落后于前沿模型。通过将Gemini作为模块化的“AI协处理器”嵌入,苹果避免了追赶的巨大成本,同时瞬间匹配了ChatGPT级别的能力。这笔交易还蕴含着商业智慧:苹果通过使用外部模型规避了反垄断审查,而谷歌则为Gemini获得了庞大的分发渠道。对用户而言,问题在于一个由谷歌驱动的Siri是否还能延续苹果的隐私承诺。

技术深度解析

此次公告背后的架构变革远比简单的API替换更为深刻。苹果构建了一套双路径推理系统,根据复杂度将Siri请求路由至两个不同的通道。

路径1:设备端苹果LLM(隐私优先)
对于简单、对延迟敏感的任务——设置计时器、发送信息、控制HomeKit设备——Siri仍使用苹果自有小型语言模型(SLM),很可能是2024年首次公布的3B参数模型的变体。该模型完全在A19和M5芯片的神经引擎上运行,零数据离开设备。苹果在此的关键优势是差分隐私设备端学习,这是任何基于云的竞争对手都无法比拟的。

路径2:云端Gemini(复杂推理)
当Siri检测到复杂查询——多步骤规划、代码生成、文档摘要或开放式创意任务——请求会被加密并发送至一个由苹果运营的专用推理集群,该集群运行谷歌的Gemini 2.0 Ultra模型。苹果构建了一个私有计算中继,在请求到达Gemini前剥离所有用户标识符,且谷歌已同意严格的“无日志、无训练”条款。这是首个在如此隐私优先的服务水平协议下部署的主流云端AI模型。

“AI协处理器”类比
苹果工程团队将此描述为类似于M1芯片统一内存架构的引入。正如M1在CPU和GPU之间移动数据而无需复制,新的Siri架构在设备端模型和云端模型之间移动上下文,而不暴露原始用户数据。该系统使用一个上下文蒸馏层——一个小型Transformer,在将对话历史发送至Gemini之前将其压缩为隐私安全的嵌入向量。这减少了攻击面,并确保即使云端模型被攻破,攻击者也只会看到抽象化的向量,而非原始文本。

基准性能
苹果分享的内部早期基准测试显示了显著提升:

| 基准测试 | 旧Siri(苹果LLM) | 新Siri(苹果+Gemini) | 提升幅度 |
|---|---|---|---|
| 多轮对话连贯性(BLEU-4) | 12.3 | 34.7 | +182% |
| 代码生成准确率(HumanEval) | 28.1% | 78.4% | +179% |
| 复杂推理(GSM8K) | 42.5% | 91.2% | +115% |
| 平均响应延迟(复杂查询) | 4.2秒 | 2.1秒 | -50% |

数据要点: 这些数字证实了许多人的猜测:苹果的设备端模型在基本任务之外根本不具竞争力。Gemini集成在每一项关键指标上都带来了2-3倍的性能飞跃,同时将延迟减半——这直接得益于谷歌优化的TPU基础设施。

相关开源工作
对于希望探索类似混合架构的开发者,llama.cpp GitHub仓库(现已有75k+星标)提供了在设备端运行小模型的参考实现。vLLM项目(45k+星标)展示了如何在云端高效服务大模型。苹果的方法有效地结合了这两种范式,尽管其拥有专有的隐私层。

关键参与者与案例研究

苹果:务实主义者
苹果的决定是一次惊人的逆转。多年来,该公司将自己定位为隐私守护者,嘲笑竞争对手在云端囤积用户数据。如今,它承认仅靠隐私无法赢得AI竞赛。这里的关键人物是苹果AI负责人John Giannandrea,据称他在内部测试显示苹果模型落后18个月后推动了Gemini交易,以及Craig Federighi,他设计了隐私中继架构。苹果的战略现已清晰:掌控用户体验和隐私层,但将繁重工作外包。

谷歌:特洛伊木马
对谷歌而言,这是一记妙招。Gemini如今拥有了直达超过20亿台活跃苹果设备的管道。Sundar PichaiDemis Hassabis(谷歌DeepMind CEO)长期以来一直寻求让Gemini成为“AI的操作系统”。这笔交易恰好给了他们这一点——且无需承担强迫用户从苹果切换而来的反垄断风险。为Gemini提供动力的谷歌TPU v5e芯片,现在实际上由苹果的计算预算补贴。据传财务条款采用收入分成模式:苹果按查询付费,但谷歌也能获取匿名化使用数据,从而改善Gemini在消费任务上的表现。

竞争格局

| 助手 | 基础模型 | 隐私模型 | 复杂推理 | 生态系统锁定 |
|---|---|---|---|---|
| Siri(新版) | Gemini 2.0 Ultra | 设备端苹果SLM | 优秀 | 极高(苹果) |
| ChatGPT(iOS应用) | GPT-4o | 无(全云端) | 优秀 | 低 |
| Google Assistant | Gemini 2.0 Pro | 设备端Gemini Nano | 非常好 | 高(谷歌) |
| Amazon Alexa | Amazon Nova | 设备端Alexa SLM | 良好 | 中等(亚马逊) |

数据要点: 新版Siri现在在复杂推理方面与ChatGPT不相上下,同时通过设备端处理提供了无与伦比的隐私保护。

时间归档

June 2026809 篇已发布文章

延伸阅读

苹果将Siri大脑外包给豆包:iPhone变身AI终端在蒂姆·库克最后一次WWDC主题演讲上,苹果做出了一项震动行业的决定:用豆包大语言模型彻底重建Siri。iPhone从此不再是智能手机,而是一个AI原生终端。这标志着苹果承认自研AI落后,并押注第三方模型来拯救用户体验。AI智能体“总开关”争夺战:平台控制权如何重塑人工智能竞争格局人工智能领域的竞争正经历一场根本性的静默转向。随着大语言模型逐渐商品化,战略主战场已从纯粹的智能比拼,转向对用户初始指令——即激活整个AI智能体生态的“总开关”——的控制。谁掌握了这个入口,谁就掌控了新兴智能体经济中的价值流、数据流与服务流AI工业革命:资本、硬件与实体部署重塑竞争格局人工智能产业正经历根本性变革,从算法突破迈入由资本耐力、硬件主权与实体部署定义的新纪元。亚马逊、苹果与特斯拉近期的战略动作揭示了一种全新竞争范式——成功取决于对算力基础设施、垂直整合与物理具身化的掌控。征服西方市场:扫地机器人真正的技术试金石扫地机器人行业已走出吸力与路径规划的军备竞赛。追觅科技孟佳指出,真正的技术试炼场在西方——那里严苛的消费者、严格的法规与多样化的家居环境,正推动这一品类从清洁工具向智能家居代理完成根本性蜕变。

常见问题

这次模型发布“Apple Bets on Google Gemini: The Pragmatic AI Pivot That Changes Everything”的核心内容是什么?

At WWDC26, Apple unveiled the long-awaited Siri overhaul, but the industry was stunned to learn the assistant's complex reasoning now runs on Google's Gemini models. This marks a r…

从“Will Siri with Gemini be free or require a subscription?”看,这个模型发布为什么重要?

The architectural shift at the heart of this announcement is more profound than a simple API swap. Apple has built a dual-path inference system that routes Siri requests through two distinct channels based on complexity.…

围绕“How does Apple's privacy relay work with Google Gemini?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。