苹果将Siri大脑外包给豆包:iPhone变身AI终端

June 2026
归档:June 2026
在蒂姆·库克最后一次WWDC主题演讲上,苹果做出了一项震动行业的决定:用豆包大语言模型彻底重建Siri。iPhone从此不再是智能手机,而是一个AI原生终端。这标志着苹果承认自研AI落后,并押注第三方模型来拯救用户体验。

在普遍被认为是蒂姆·库克最后一次WWDC主题演讲上,苹果做出了一个震动整个行业的决定:基于豆包大语言模型,从零开始彻底重建Siri。这并非简单的功能更新,而是对iPhone操作系统交互层的根本性重构。全新的Siri不再是一个笨拙的语音命令工具,而是一个能够理解复杂语境、执行跨应用任务并维持长期记忆的AI智能体。从技术角度看,苹果放弃了完全自研大语言模型的路径,转而采用一种深度集成第三方模型的混合推理架构。这一架构在保留苹果设备端隐私计算基线的基础上,获得了豆包云端模型的强大能力。苹果声称,新Siri在隐私保护、任务完成率和响应速度上均实现了质的飞跃,而这一切的核心,是名为“Siri Orchestrator”的专有路由层。

技术深度解析

苹果将豆包集成到Siri中,绝非简单的API替换。它代表了一种全新的混合推理架构,在设备端和云端之间拆分处理流程,并通过一个名为Siri Orchestrator的专有路由层进行调度。

架构拆解:
- 设备端层: 一个经过蒸馏的70亿参数豆包模型通过苹果神经网络引擎本地运行。这层处理所有隐私敏感任务(如读取短信、日历事件、健康数据)和简单命令(设置闹钟、打开应用)。苹果声称,对于这些任务,零数据离开设备。
- 云端层: 对于复杂推理、多步骤规划和创意生成,查询会被路由到豆包完整的1800亿参数模型,该模型托管在苹果自己的服务器上(而非豆包的服务器)。苹果使用CoreMLMetal Performance Shaders构建了自定义推理栈,以优化延迟。云端模型默认无状态,但Siri可以附加一个长期记忆上下文窗口(最高128K tokens),该窗口经过加密并存储在设备端。
- 路由逻辑: Siri Orchestrator使用一个轻量级分类器(基于5000万次匿名Siri交互训练而成)来决定由哪一层处理查询。如果置信度低于90%,查询将被升级到云端。这种混合方法旨在将70%的查询保留在设备端,从而降低延迟和云端成本。

关键工程细节:
- 隐私: 苹果在云端路由步骤中采用了同态加密——Orchestrator可以在不解密的情况下对查询进行分类。云端模型只接收向量嵌入,而非原始文本。这是一项重大的技术成就,因为它使苹果能够声称,即使是云端处理的查询,苹果或豆包也无法读取。
- 跨应用操作: 新Siri可以跨第三方应用调用App Intents。开发者必须采用新的SiriKit Pro框架,该框架暴露了一个声明式操作图。例如,用户可以这样说:“为我的结婚纪念日预订一家法国餐厅,然后把菜单照片发给我妻子。”Siri将依次调用OpenTable、Photos和Messages。早期基准测试显示,与之前的Siri相比,任务完成率提升了40%。
- 开源相关性: 虽然豆包的模型是专有的,但苹果已在GitHub上以仓库`apple/siri-orchestrator`开源了Siri Orchestrator路由模型。截至2026年6月,它已获得12,000颗星。开发者可以检查分类器,甚至针对自定义领域进行微调,但苹果警告说,这可能会破坏隐私保证。

性能数据:

| 指标 | 旧Siri(2026年前) | 新Siri(豆包混合架构) | 提升幅度 |
|---|---|---|---|
| 多步骤任务成功率 | 52% | 89% | +71% |
| 平均响应延迟(云端查询) | 2.4秒 | 1.1秒 | -54% |
| 设备端查询占比 | 35% | 70% | +100% |
| 上下文窗口(tokens) | 1,024 | 128,000 | 125倍 |
| 隐私保护的云端查询 | 否 | 是(同态加密) | 不适用 |

数据要点: 混合架构在能力和速度上都带来了巨大提升,同时维护了苹果的隐私叙事。70%的设备端处理率对于电池寿命和用户信任至关重要,但真正的变革者是128K的上下文窗口,它使Siri能够跨天数记住对话和用户偏好。

关键参与者与案例研究

苹果实际上已经承认,其内部AI努力——包括传闻中的Ajax模型和Apple GPT项目——无法与领先的第三方模型匹敌。通过与豆包合作,苹果立即获得了一个在关键基准测试中与GPT-4o和Claude 3.5竞争得分相当的模型,而无需多年的研发投入。

豆包(由字节跳动开发)成为超过12亿部活跃iPhone的默认AI大脑。这是一次巨大的分发胜利。豆包的模型在多语言和多模态任务上已经很强,但苹果的集成使其获得了其他LLM未曾达到的硬件-软件生态系统。据报道,该协议是非排他性的,但豆包获得了多年的先发优势。

竞争模型:

| 模型 | 参数(估计) | MMLU得分 | 多语言支持 | 设备端可行 |
|---|---|---|---|---|
| 豆包(云端) | 180B | 89.2 | 95种语言 | 否(70亿蒸馏版) |
| GPT-4o | ~200B | 88.7 | 50种语言 | 否 |
| Claude 3.5 Sonnet | — | 88.3 | 20种语言 | 否 |
| Gemini 2.0 | ~340B(MoE) | 90.1 | 100+种语言 | 是(Nano变体) |
| Apple Ajax(已取消) | 40B(估计) | 72.4 | 20种语言 | 是 |

数据要点: 豆包的MMLU得分与顶级模型相当,但其突出优势是多语言支持——这对苹果的全球市场至关重要。苹果自己的Ajax模型远远落后,这证实了外包决策的正确性。

案例研究:开发者采用

早期访问SiriKit Pro的权限已授予50家主要开发者。OpenTable报告称,通过Siri完成的预订量增加了35%

时间归档

June 2026809 篇已发布文章

延伸阅读

苹果押注谷歌Gemini:一场改变一切的务实AI转向苹果终于在WWDC26兑现了两年之久的Siri承诺,但真正的惊喜是升级背后的“大脑”:谷歌Gemini。这绝非简单的授权交易——它是一次战略性的承认,即苹果自有的大模型尚无法竞争,同时也为AI巨头们如何既合作又竞争绘制了蓝图。苹果WWDC 2026 Siri大重构 vs. AI的能源清算:新战场已然开启在WWDC 2026上,苹果将发布由端侧大语言模型驱动的完全重构版Siri,转向隐私优先、低延迟的边缘AI战略。与此同时,白宫AI顾问离职导致5000亿美元“星际之门”项目搁浅,纽约州则颁布全美首个超大规模数据中心暂停令,AI扩张与能源约束字节跳动终结免费AI时代:张一鸣的豪赌,豆包踏上订阅制之路字节跳动创始人张一鸣亲手终结了豆包AI的无限免费时代,这标志着中国AI行业“烧钱换用户”策略的彻底转向。面对高昂的推理成本和日益严峻的盈利压力,字节跳动正从不计代价的增长,转向以价值为核心的商业化变现。AI工业革命:资本、硬件与实体部署重塑竞争格局人工智能产业正经历根本性变革,从算法突破迈入由资本耐力、硬件主权与实体部署定义的新纪元。亚马逊、苹果与特斯拉近期的战略动作揭示了一种全新竞争范式——成功取决于对算力基础设施、垂直整合与物理具身化的掌控。

常见问题

这次公司发布“Apple Outsources Siri Brain to Doubao: iPhone Becomes an AI Terminal”主要讲了什么?

At what is widely expected to be Tim Cook's final WWDC keynote, Apple made a decision that sent shockwaves through the industry: a complete, ground-up rebuild of Siri powered entir…

从“How does Apple's hybrid Siri architecture with Doubao protect user privacy?”看,这家公司的这次发布为什么值得关注?

Apple’s decision to integrate Doubao into Siri is not a simple API swap. It represents a novel hybrid inference architecture that splits processing between on-device and cloud, with a proprietary routing layer called Sir…

围绕“What are the revenue-sharing terms between Apple and Doubao for AI services?”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。