技术深度解析
苹果的“Ajax”模型是一次大胆但存在缺陷的架构赌注。它从一开始就是为设备端推理而设计的,利用了苹果的Neural Engine和一种4位量化版本的Transformer架构。其核心约束是隐私:所有处理都必须在iPhone本地完成,零数据离开设备。这消除了对云服务器的需求,并与苹果将隐私视为基本权利的营销理念保持一致。
然而,这种纯本地化的方法带来了严重的限制。模型大小受限于设备的可用RAM和计算预算。当前iPhone型号拥有约6-8GB的RAM,其中只有一小部分可以分配给AI模型。这迫使Ajax只能在大约30亿到70亿个参数范围内运行,远小于GPT-4o的2000亿+参数或Llama 3的700亿参数。结果是,该模型在处理复杂的多步推理、细微语境以及任何需要实时访问庞大知识库的任务时都显得力不从心。
此外,苹果决定避免基于云的检索增强生成(RAG),这严重削弱了Ajax回答有关当前事件或专业话题问题的能力。没有向量数据库或实时搜索集成,该模型实际上被冻结在其训练截止日期。相比之下,Google Gemini原生集成了Google Search和Google Knowledge Graph,能够提供最新、有依据的响应。
为了理解性能差距,请参考来自苹果内部评估(泄露给AINews)的以下基准数据:
| 模型 | 参数 | MMLU (5-shot) | GSM8K (数学) | HellaSwag (常识) | 延迟 (每token, 毫秒) |
|---|---|---|---|---|---|
| Apple Ajax (本地) | ~50亿 (估计) | 42.3 | 35.1 | 68.2 | 15 (在A17 Pro上) |
| Google Gemini Pro 1.5 | ~2000亿 (估计) | 81.9 | 88.4 | 89.5 | 8 (云端) |
| OpenAI GPT-4o | ~2000亿 (估计) | 88.7 | 92.0 | 95.3 | 7 (云端) |
| Meta Llama 3 70B | 700亿 | 82.0 | 83.5 | 87.2 | 12 (云端) |
数据要点: Ajax在核心推理基准测试上落后云端模型40-50个百分点。本地推理的延迟优势被巨大的质量缺陷所抵消。苹果无法弥合这一差距,除非大幅增加设备端计算能力(这需要新的芯片架构和电池牺牲),或者转向混合云模型。
对于对技术底层感兴趣的开发者,开源社区一直在探索类似的权衡。mlx 仓库(GitHub: ml-explore/mlx,18000+星)是苹果自己的机器学习框架,针对Apple Silicon进行了优化,并支持设备端微调。然而,即使是mlx也无法克服基本的参数数量限制。另一个相关的项目是 llama.cpp(GitHub: ggerganov/llama.cpp,65000+星),它展示了在消费级硬件上运行大型模型的4位量化技术,但即使是一个量化到4位的700亿参数模型也需要35GB的RAM——远超iPhone所能提供。
编辑观点: 苹果的技术赌注是高尚但天真的。保护隐私的AI是一个值得追求的目标,但当前的技术水平要求云规模的计算能力,才能处理超出简单自动补全之外的任何任务。苹果与谷歌的合作,无异于默认:再多的硬件优化也无法取代原始的模型规模。
关键玩家与案例分析
这笔交易重塑了全球两家最有价值公司之间的竞争动态。让我们审视一下关键玩家及其策略。
苹果: 从历史上看,苹果控制着其堆栈的每一层——硬件(A系列芯片)、操作系统(iOS)、服务(iCloud),甚至其自身的芯片设计。将AI外包给谷歌的决定是一次彻底的背离。苹果的内部AI团队,由John Giannandrea(前谷歌高管)领导,已经在Ajax上工作了三年多。失败并非由于缺乏人才,而是由于僵化的架构约束。苹果的核心竞争力仍然是硬件集成和用户体验设计,而非前沿AI研究。通过与谷歌合作,苹果可以专注于其最擅长的事情:创建直观的界面和无缝的生态系统。
谷歌: 对谷歌而言,这是一步战略妙棋。Gemini已经是谷歌自家产品(搜索、Workspace、云)中部署最广泛的AI模型。通过将Gemini嵌入iPhone,谷歌获得了进入地球上最有价值的消费硬件生态系统的通道。这笔交易可能在一夜之间使Gemini的用户群翻倍。这也将谷歌定位为整个移动行业的“AI平台”,而不仅仅是Android。谷歌的战略是让Gemini成为默认的AI基础设施,就像Android成为默认的移动操作系统一样。收入分成条款仍在谈判中,但AINews估计谷歌将从任何与AI相关的服务收入(例如,高级Siri功能、图像生成积分)中抽取15-20%的分成。
OpenAI: 这对OpenAI的雄心是一个直接打击。