技术深度解析
苹果将豆包集成到Siri中,绝非简单的API替换。它代表了一种全新的混合推理架构,在设备端和云端之间拆分处理流程,并通过一个名为Siri Orchestrator的专有路由层进行调度。
架构拆解:
- 设备端层: 一个经过蒸馏的70亿参数豆包模型通过苹果神经网络引擎本地运行。这层处理所有隐私敏感任务(如读取短信、日历事件、健康数据)和简单命令(设置闹钟、打开应用)。苹果声称,对于这些任务,零数据离开设备。
- 云端层: 对于复杂推理、多步骤规划和创意生成,查询会被路由到豆包完整的1800亿参数模型,该模型托管在苹果自己的服务器上(而非豆包的服务器)。苹果使用CoreML和Metal Performance Shaders构建了自定义推理栈,以优化延迟。云端模型默认无状态,但Siri可以附加一个长期记忆上下文窗口(最高128K tokens),该窗口经过加密并存储在设备端。
- 路由逻辑: Siri Orchestrator使用一个轻量级分类器(基于5000万次匿名Siri交互训练而成)来决定由哪一层处理查询。如果置信度低于90%,查询将被升级到云端。这种混合方法旨在将70%的查询保留在设备端,从而降低延迟和云端成本。
关键工程细节:
- 隐私: 苹果在云端路由步骤中采用了同态加密——Orchestrator可以在不解密的情况下对查询进行分类。云端模型只接收向量嵌入,而非原始文本。这是一项重大的技术成就,因为它使苹果能够声称,即使是云端处理的查询,苹果或豆包也无法读取。
- 跨应用操作: 新Siri可以跨第三方应用调用App Intents。开发者必须采用新的SiriKit Pro框架,该框架暴露了一个声明式操作图。例如,用户可以这样说:“为我的结婚纪念日预订一家法国餐厅,然后把菜单照片发给我妻子。”Siri将依次调用OpenTable、Photos和Messages。早期基准测试显示,与之前的Siri相比,任务完成率提升了40%。
- 开源相关性: 虽然豆包的模型是专有的,但苹果已在GitHub上以仓库`apple/siri-orchestrator`开源了Siri Orchestrator路由模型。截至2026年6月,它已获得12,000颗星。开发者可以检查分类器,甚至针对自定义领域进行微调,但苹果警告说,这可能会破坏隐私保证。
性能数据:
| 指标 | 旧Siri(2026年前) | 新Siri(豆包混合架构) | 提升幅度 |
|---|---|---|---|
| 多步骤任务成功率 | 52% | 89% | +71% |
| 平均响应延迟(云端查询) | 2.4秒 | 1.1秒 | -54% |
| 设备端查询占比 | 35% | 70% | +100% |
| 上下文窗口(tokens) | 1,024 | 128,000 | 125倍 |
| 隐私保护的云端查询 | 否 | 是(同态加密) | 不适用 |
数据要点: 混合架构在能力和速度上都带来了巨大提升,同时维护了苹果的隐私叙事。70%的设备端处理率对于电池寿命和用户信任至关重要,但真正的变革者是128K的上下文窗口,它使Siri能够跨天数记住对话和用户偏好。
关键参与者与案例研究
苹果实际上已经承认,其内部AI努力——包括传闻中的Ajax模型和Apple GPT项目——无法与领先的第三方模型匹敌。通过与豆包合作,苹果立即获得了一个在关键基准测试中与GPT-4o和Claude 3.5竞争得分相当的模型,而无需多年的研发投入。
豆包(由字节跳动开发)成为超过12亿部活跃iPhone的默认AI大脑。这是一次巨大的分发胜利。豆包的模型在多语言和多模态任务上已经很强,但苹果的集成使其获得了其他LLM未曾达到的硬件-软件生态系统。据报道,该协议是非排他性的,但豆包获得了多年的先发优势。
竞争模型:
| 模型 | 参数(估计) | MMLU得分 | 多语言支持 | 设备端可行 |
|---|---|---|---|---|
| 豆包(云端) | 180B | 89.2 | 95种语言 | 否(70亿蒸馏版) |
| GPT-4o | ~200B | 88.7 | 50种语言 | 否 |
| Claude 3.5 Sonnet | — | 88.3 | 20种语言 | 否 |
| Gemini 2.0 | ~340B(MoE) | 90.1 | 100+种语言 | 是(Nano变体) |
| Apple Ajax(已取消) | 40B(估计) | 72.4 | 20种语言 | 是 |
数据要点: 豆包的MMLU得分与顶级模型相当,但其突出优势是多语言支持——这对苹果的全球市场至关重要。苹果自己的Ajax模型远远落后,这证实了外包决策的正确性。
案例研究:开发者采用
早期访问SiriKit Pro的权限已授予50家主要开发者。OpenTable报告称,通过Siri完成的预订量增加了35%