技术深度解析
苹果的Siri改革涉及两个相互交织的技术组件:用于自动删除聊天的隐私架构,以及后端集成谷歌Gemini模型。自动删除机制在设备层面实现,利用苹果的Secure Enclave和端侧处理。当用户结束Siri会话时,系统会触发对话令牌的加密擦除,使数据即使从苹果服务器也无法恢复。这与标准做法截然不同——后者中,云端AI助手会保留日志用于模型改进。苹果的实现采用“会话级临时存储”,为每次交互分配一个临时内存缓冲区,在用户关闭Siri或30秒无活动超时后清零。这一设计灵感来自差分隐私技术,但应用于对话状态管理。
Gemini的集成更为微妙。苹果并未直接向用户暴露Gemini的API;相反,Siri的自然语言理解管道现在将复杂查询——需要多步推理、代码生成或创意写作的请求——通过私有API网关路由到Gemini。该网关在将查询发送到谷歌服务器之前,会剥离所有个人身份信息(PII),且返回的响应不带任何会话令牌。自动删除机制确保,即使谷歌服务器记录了查询,日志也会在合同协议下匿名化并在24小时内删除。这是一项重大的工程壮举:苹果必须构建一个“无上下文”的查询解析器,能够在不依赖先前对话历史的情况下处理复杂请求——这与大多数LLM的设计方式完全相反。
在开源领域,社区也在探索类似思路。GitHub仓库“private-llm”(近期获得4200颗星)提供了一个运行具有临时内存的LLM的框架,但尚未达到生产就绪状态。另一个仓库“oblivious-llm”(2800颗星)实现了用于私有推理的加密协议,但其延迟过高,无法用于实时Siri。苹果的方案是专有的,但“无状态LLM服务”这一底层概念正在斯坦福和MIT等机构的研究论文中获得关注。
| 特性 | 苹果Siri(新版) | 谷歌助手 | 亚马逊Alexa |
|---|---|---|---|
| 聊天自动删除 | 是(会话级) | 否(保留历史) | 否(保留历史) |
| 后端LLM | 谷歌Gemini(私有) | Gemini(公开) | 亚马逊Titan |
| 端侧处理 | 是(Secure Enclave) | 部分 | 极少 |
| PII剥离 | 是(API调用前) | 否 | 否 |
| 会话上下文保留 | 无 | 完整历史 | 完整历史 |
数据要点: 苹果的架构以牺牲长期个性化换取隐私,而竞争对手则以数据暴露为代价保留上下文。这一权衡将定义用户体验差异——Siri可能随时间推移显得不那么“聪明”,但更值得信赖。
关键参与者与案例研究
两个主要参与者是苹果和谷歌,但动态涉及多个其他角色。苹果Siri团队由John Giannandrea(前谷歌高管)领导,一直面临追赶竞争对手的压力。Giannandrea的背景至关重要:他曾在谷歌负责AI工作,2018年加入苹果,他的人脉很可能促成了这次Gemini交易。苹果决定使用Gemini,等于默认其自身模型——如Ajax框架和传闻中的“Apple GPT”——尚未准备好投入实际应用。据苹果内部基准测试显示,其最大模型(2000亿参数)在MMLU上得分为82.3,而Gemini Ultra为90.0。差距显著。
谷歌通过其DeepMind部门,一直在积极向第三方授权Gemini。苹果交易是其迄今为止最大的一笔,超过了与三星和小米的合作。谷歌的策略是将Gemini嵌入尽可能多的生态系统,即使这意味着将隐私控制权让给合作伙伴。这是一个经过计算的风险:谷歌获得使用数据(匿名化)和品牌曝光,但也面临苹果最终用自有模型取代Gemini的可能性。
其他参与者正在密切关注。亚马逊Alexa据传正在与Anthropic洽谈类似集成,而微软Copilot已在使用OpenAI的模型。移动AI助手市场正成为“模型即服务”的战场,设备制造商将智能外包给最佳可用LLM。
| 公司 | 使用模型 | 隐私特性 | 美国市场份额 |
|---|---|---|---|
| 苹果 | Gemini(通过谷歌) | 自动删除、PII剥离 | 45%(iPhone用户) |
| 谷歌 | Gemini(原生) | 历史保留、可退出 | 30%(Android用户) |
| 亚马逊 | Titan(原生) | 历史保留、可退出 | 15%(Echo用户) |
| 微软 | GPT-4(通过OpenAI) | 企业级控制 | 10%(Windows用户) |
数据要点: 苹果的隐私