技术深度解析
互联网商业模式的死亡不是比喻,而是架构上的必然。传统数字平台遵循双边市场逻辑:它们聚合供给(内容、产品、服务)和需求(用户、买家),并从连接中抽取租金。Google搜索将查询与结果之间的间隙变现;Amazon将产品列表与购买之间的间隙变现;Facebook将用户与广告之间的间隙变现。LLM和AI代理正在消除这些间隙。
推理层:新的瓶颈
关键的技术转变是“推理层”的出现。在旧的技术栈中,我们有:
- 基础设施层(云、算力)
- 平台层(搜索、社交、电商)
- 应用层(网站、应用)
平台层曾是护城河,因为它控制了供给的索引和需求的注意力。现在,LLM在应用层之上引入了一个新层:推理层。这一层接收自然语言意图,将其分解为子任务,从多个来源(通过网页搜索、API或向量数据库等工具)检索信息,并综合生成一个动作或答案。LLM不只是检索一个链接;它推理用户真正需要什么。
例如,考虑OpenAI的Operator(2025年初发布)或Anthropic的Computer Use这样的AI代理。这些代理可以浏览浏览器、填写表单、跨多个电商网站比价并完成购买。它们不点击广告,不浏览赞助结果。它们直接前往最相关的来源。平台的广告收入模式被完全绕过。
去中介化的技术机制
1. 工具使用与函数调用:现代LLM(GPT-4o、Claude 3.5、Gemini 2.0)支持函数调用,允许它们调用外部API——航班预订API、支付网关、库存系统——无需人类中介。这使LLM成为直接的交易代理。
2. 多代理系统:AutoGPT(GitHub星标16万+)、CrewAI(2.5万+星标)和Microsoft的AutoGen(3.5万+星标)等框架允许多个LLM代理协作。一个代理可以谈判合同,另一个检查法律合规性。这些系统正在取代整个B2B平台。
3. 检索增强生成(RAG):RAG管道允许LLM从专有数据库、公共网络资源或内部文档中拉取实时数据。这意味着AI代理可以在不访问传统网站的情况下回答问题或完成任务。“内容”被AI消费,而不是被拥有可变现眼球的人类消费。
4. 自主网页导航:WebGPT(OpenAI)和基于Playwright的开源代理等项目可以执行JavaScript、处理Cookie并填写表单。它们模拟人类浏览,但效率完美——无干扰、无广告、无冲动购买。
数据表:领先AI代理在自主任务完成上的表现
| 代理/模型 | 任务完成率(WebArena) | 平均步骤数/任务 | 每任务成本(API) | 人类基线 |
|---|---|---|---|---|
| GPT-4o + Operator | 78.4% | 12.3 | $0.42 | 92.1% |
| Claude 3.5 + Computer Use | 71.2% | 15.1 | $0.38 | 92.1% |
| Gemini 2.0 + Agentic | 69.8% | 14.7 | $0.35 | 92.1% |
| 开源(AutoGPT + GPT-4) | 52.3% | 22.4 | $0.55 | 92.1% |
数据要点:虽然仍低于人类表现,但顶级专有代理的任务完成率已接近80%。按此速度,到2026年底,AI代理将在常规数字任务上达到或超越人类。当那一刻到来时,人类注意力在传统平台上的经济价值将彻底崩溃。
关键玩家与案例研究
争夺推理层控制权的竞赛分为三个阵营:模型制造商、平台巨头和代理原生初创公司。
阵营一:模型制造商(OpenAI、Anthropic、Google DeepMind)
这些公司正在构建推理引擎。他们的战略是让LLM成为所有数字交互的默认界面。
- OpenAI:凭借GPT-4o和Operator代理,OpenAI正将自己定位为“代理的操作系统”。他们最近推出了用于自定义代理的“GPT Store”,从代理与代理之间的交易中抽取20%的佣金。这是直接取代应用商店模式的举措。
- Anthropic:Claude 3.5 Sonnet的“Computer Use”功能允许模型控制桌面环境。Anthropic瞄准企业工作流——自动化数据录入、CRM管理和采购。他们按任务收费,而非按用户收费,绕过了传统的SaaS订阅模式。
- Google DeepMind:Gemini 2.0与Google自身的服务(搜索、地图、Gmail)深度集成。Google的策略是防御性的:将推理层与其现有广告生态系统绑定。但这造成了利益冲突——Gemini必须决定是展示广告还是给出最佳答案。早期测试显示,Gemini经常