技术深度解析
从以模型为中心到以基础设施为中心的AI转变,需要对系统架构进行根本性重新思考。传统的三层架构——应用、API、模型——正被四层架构取代:入口层、编排层、执行层和模型层。价值正集中在前两层。
入口层: 这是面向用户的界面。它可以是操作系统(Apple Intelligence、Windows Copilot)、浏览器(集成Gemini的Google Chrome、集成Copilot的Microsoft Edge)或超级应用(微信、Telegram、WhatsApp)。关键的技术要求是上下文持久化和权限管理。例如,Apple的方法使用设备端处理,配合一个能跨应用理解用户数据的语义索引,使Siri能够执行诸如“把昨天那张照片发给妈妈”之类的操作,而无需显式切换应用。这需要一种新型的操作系统级API,以安全、沙盒化的方式暴露应用功能。Microsoft的Windows Copilot采取了不同的方法,使用系统级侧边栏,通过UI自动化和原生插件的组合与任何Win32或UWP应用交互。GitHub仓库[microsoft/PowerToys](https://github.com/microsoft/PowerToys)(目前拥有110k+星标)包含实验性的AI驱动工具,如Advanced Paste功能,展示了操作系统如何拦截并转换用户操作。
编排层: 这是将用户意图路由到适当模型或服务的中间件。它处理提示工程、工具选择和多步骤推理。开源项目[langchain-ai/langchain](https://github.com/langchain-ai/langchain)(100k+星标)已成为构建这些编排流水线的事实标准。然而,真正的创新发生在针对延迟和成本进行优化的专有系统中。例如,一个简单的用户请求“在办公室附近找一家意大利餐厅,今晚7点订4位”可能需要:地理位置查询、通过Google Maps API搜索餐厅、通过OpenTable API预订、通过Google Calendar API检查日历、以及通过Stripe处理支付。每一步都是一个潜在的收费点。像[fixie.ai](https://fixie.ai)这样的公司正在构建抽象这种复杂性的平台,为多步骤执行提供单一API。
执行层: 这是AI输出转化为现实行动的地方。这里的关键基础设施是支付轨道和身份验证。例如,Stripe的新AI工具包允许AI代理直接发起支付。这是一个巨大的转变:以前,AI只能推荐产品;现在,它可以完成购买。技术挑战在于为代理发起的交易构建可靠、安全且可审计的系统。这需要新的授权协议——AI如何证明它有权代表用户花费200美元?——以及争议解决机制。GitHub仓库[stripe/stripe-python](https://github.com/stripe/stripe-python)(1.5k+星标)已更新了用于AI驱动支付的新端点,包括一个`PaymentIntent.create_with_agent`方法,该方法包含用于审计追踪的唯一代理ID。
| 层级 | 关键玩家 | 技术挑战 | 收入模式 |
|---|---|---|---|
| 入口层 | Apple, Microsoft, Google, Meta | 上下文持久化、权限管理 | 订阅(Apple One, Microsoft 365)或广告收入(Google) |
| 编排层 | LangChain, Fixie, Vercel AI SDK | 多步骤推理、延迟优化 | 按次API调用收费(通常每次操作$0.001-$0.01) |
| 执行层 | Stripe, PayPal, Square, OpenTable, Uber API | 安全的代理发起支付、身份验证 | 交易手续费(支付类2.9% + $0.30) |
| 模型层 | OpenAI, Anthropic, Google DeepMind, Meta | 智能、安全、成本效率 | 按Token计费(价格快速下降) |
数据要点: 执行层拥有最高的利润率(交易手续费),而模型层最低(商品化的Token定价)。入口层由于转换成本和网络效应,提供了最具防御性的地位。
关键玩家与案例分析
Apple:沉默的基础设施建设者
Apple的策略最具战略性。通过将AI深度集成到iOS和macOS中,他们正在修建一条每个第三方应用都必须使用的收费公路。在WWDC 2024上宣布的Apple Intelligence不仅仅是一个聊天机器人;它是一个能够控制应用的系统级AI。关键在于App Intents,这是一个允许开发者向AI暴露特定操作的框架。例如,一个照片编辑应用可以暴露一个“移除背景”意图。当用户要求Siri执行此操作时,Apple的AI会编排该操作,但实际执行发生在应用内部。Apple对此不直接收取费用,但其价值在于生态系统的锁定。未能实现App Intents的开发者将对AI不可见,实际上被排除在AI驱动的交互之外。