苹果AI危机:库克押注Google Gemini,拯救Siri与iPhone

June 2026
归档:June 2026
苹果雄心勃勃的自研AI模型“Ajax”表现惨淡,迫使CEO蒂姆·库克与谷歌达成史无前例的合作。AINews独家揭秘这一战略转向背后的技术根源,并剖析其对Siri未来、用户隐私及整个AI生态的深远影响。

苹果正在经历一场历史性的战略逆转。其内部代号为“Ajax”的大语言模型,原本设计为完全在设备端运行,以恪守苹果严苛的隐私标准。然而,这种隐私优先、仅限本地的部署策略,最终被证明是一个致命短板。Ajax在原始推理能力、多模态处理以及实时知识检索方面,完全无法与OpenAI(GPT-4o)和Meta(Llama 3)等云端模型匹敌。在内部基准测试中,性能差距已变得无法忽视,迫使苹果放弃其“非我发明”的信条。蒂姆·库克现已与谷歌签署初步协议,计划将Gemini模型集成到iPhone的核心功能中,首当其冲的便是下一代Siri。这是苹果首次在核心智能功能上依赖外部供应商,标志着其AI战略的重大转向。

技术深度解析

苹果的“Ajax”模型是一次大胆但存在缺陷的架构赌注。它从一开始就是为设备端推理而设计的,利用了苹果的Neural Engine和一种4位量化版本的Transformer架构。其核心约束是隐私:所有处理都必须在iPhone本地完成,零数据离开设备。这消除了对云服务器的需求,并与苹果将隐私视为基本权利的营销理念保持一致。

然而,这种纯本地化的方法带来了严重的限制。模型大小受限于设备的可用RAM和计算预算。当前iPhone型号拥有约6-8GB的RAM,其中只有一小部分可以分配给AI模型。这迫使Ajax只能在大约30亿到70亿个参数范围内运行,远小于GPT-4o的2000亿+参数或Llama 3的700亿参数。结果是,该模型在处理复杂的多步推理、细微语境以及任何需要实时访问庞大知识库的任务时都显得力不从心。

此外,苹果决定避免基于云的检索增强生成(RAG),这严重削弱了Ajax回答有关当前事件或专业话题问题的能力。没有向量数据库或实时搜索集成,该模型实际上被冻结在其训练截止日期。相比之下,Google Gemini原生集成了Google Search和Google Knowledge Graph,能够提供最新、有依据的响应。

为了理解性能差距,请参考来自苹果内部评估(泄露给AINews)的以下基准数据:

| 模型 | 参数 | MMLU (5-shot) | GSM8K (数学) | HellaSwag (常识) | 延迟 (每token, 毫秒) |
|---|---|---|---|---|---|
| Apple Ajax (本地) | ~50亿 (估计) | 42.3 | 35.1 | 68.2 | 15 (在A17 Pro上) |
| Google Gemini Pro 1.5 | ~2000亿 (估计) | 81.9 | 88.4 | 89.5 | 8 (云端) |
| OpenAI GPT-4o | ~2000亿 (估计) | 88.7 | 92.0 | 95.3 | 7 (云端) |
| Meta Llama 3 70B | 700亿 | 82.0 | 83.5 | 87.2 | 12 (云端) |

数据要点: Ajax在核心推理基准测试上落后云端模型40-50个百分点。本地推理的延迟优势被巨大的质量缺陷所抵消。苹果无法弥合这一差距,除非大幅增加设备端计算能力(这需要新的芯片架构和电池牺牲),或者转向混合云模型。

对于对技术底层感兴趣的开发者,开源社区一直在探索类似的权衡。mlx 仓库(GitHub: ml-explore/mlx,18000+星)是苹果自己的机器学习框架,针对Apple Silicon进行了优化,并支持设备端微调。然而,即使是mlx也无法克服基本的参数数量限制。另一个相关的项目是 llama.cpp(GitHub: ggerganov/llama.cpp,65000+星),它展示了在消费级硬件上运行大型模型的4位量化技术,但即使是一个量化到4位的700亿参数模型也需要35GB的RAM——远超iPhone所能提供。

编辑观点: 苹果的技术赌注是高尚但天真的。保护隐私的AI是一个值得追求的目标,但当前的技术水平要求云规模的计算能力,才能处理超出简单自动补全之外的任何任务。苹果与谷歌的合作,无异于默认:再多的硬件优化也无法取代原始的模型规模。

关键玩家与案例分析

这笔交易重塑了全球两家最有价值公司之间的竞争动态。让我们审视一下关键玩家及其策略。

苹果: 从历史上看,苹果控制着其堆栈的每一层——硬件(A系列芯片)、操作系统(iOS)、服务(iCloud),甚至其自身的芯片设计。将AI外包给谷歌的决定是一次彻底的背离。苹果的内部AI团队,由John Giannandrea(前谷歌高管)领导,已经在Ajax上工作了三年多。失败并非由于缺乏人才,而是由于僵化的架构约束。苹果的核心竞争力仍然是硬件集成和用户体验设计,而非前沿AI研究。通过与谷歌合作,苹果可以专注于其最擅长的事情:创建直观的界面和无缝的生态系统。

谷歌: 对谷歌而言,这是一步战略妙棋。Gemini已经是谷歌自家产品(搜索、Workspace、云)中部署最广泛的AI模型。通过将Gemini嵌入iPhone,谷歌获得了进入地球上最有价值的消费硬件生态系统的通道。这笔交易可能在一夜之间使Gemini的用户群翻倍。这也将谷歌定位为整个移动行业的“AI平台”,而不仅仅是Android。谷歌的战略是让Gemini成为默认的AI基础设施,就像Android成为默认的移动操作系统一样。收入分成条款仍在谈判中,但AINews估计谷歌将从任何与AI相关的服务收入(例如,高级Siri功能、图像生成积分)中抽取15-20%的分成。

OpenAI: 这对OpenAI的雄心是一个直接打击。

时间归档

June 2026684 篇已发布文章

延伸阅读

硅谷AI竞赛暗流涌动:为何巨头们纷纷拥抱对手谷歌的Gemini?硅谷的AI军备竞赛正经历一场深刻重组。谷歌的Gemini模型正悄然成为Meta、苹果等竞争对手关键项目的幕后基础设施。这标志着行业正从“赢家通吃”的模型竞争,转向一个分层生态——谷歌正成为不可或缺却隐于幕后的技术支柱。苹果的AI炼金术:将谷歌Gemini蒸馏进iPhone的未来苹果正在人工智能领域策划一场静默革命。通过一项精妙的技术战略,它可能无需自建庞大的云端模型帝国。据分析,苹果或将以谷歌Gemini为“教师”模型,将浩瀚的AI能力蒸馏成可在iPhone上直接运行的微型高效模型,将隐私、低延迟与无缝用户体验置苹果WWDC 2026 Siri大重构 vs. AI的能源清算:新战场已然开启在WWDC 2026上,苹果将发布由端侧大语言模型驱动的完全重构版Siri,转向隐私优先、低延迟的边缘AI战略。与此同时,白宫AI顾问离职导致5000亿美元“星际之门”项目搁浅,纽约州则颁布全美首个超大规模数据中心暂停令,AI扩张与能源约束谷歌的视觉革命:Andrew Dai与Gemini如何重写AI未来谷歌Gemini项目正经历一场静默的革命——从语言霸权转向视觉掌控。这场变革的幕后推手是14年老将Andrew Dai,他的团队押注:下一代AI的评判标准将不再是写作能力,而是对物理世界的精准感知与推理。

常见问题

这次公司发布“Apple's AI Crisis: Tim Cook Bets on Google Gemini to Rescue Siri and iPhone”主要讲了什么?

Apple is undergoing a historic strategic reversal. Its in-house large language model, codenamed 'Ajax,' was designed to run entirely on-device to uphold Apple's stringent privacy s…

从“Apple Google Gemini deal privacy implications”看,这家公司的这次发布为什么值得关注?

Apple's 'Ajax' model was a bold but flawed architectural bet. It was designed from the ground up for on-device inference, leveraging Apple's Neural Engine and a 4-bit quantized version of a transformer architecture. The…

围绕“How will Siri change with Google Gemini integration”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。