API开放第二波:AI代理如何驱动新一轮平台革命

April 2026
AI agents归档:April 2026
十五年前,第一波API浪潮催生了社交应用与数据混搭的黄金时代,却最终在围墙花园与速率限制中落幕。如今,第二波API开放正悄然崛起——这一次,API不再是数据管道,而是AI代理执行真实世界行动的指令层:从预订航班到控制智能工厂,一场更深层的平台革命正在发生。

2011年前后,第一波API浪潮以Facebook和Twitter开放数据接口为标志,催生了整整一代社交应用与数据混搭(mashup)产品。然而,那个时代最终在围墙花园(walled gardens)和激进的速率限制(rate limiting)中走向终结。如今,第二波API开放正在浮现,其本质截然不同。在大语言模型(LLM)与代理化工作流(agentic workflows)的驱动下,平台正在开放允许AI代理执行操作——而不仅仅是检索数据——的API。一个需要预订酒店、发送邮件或触发支付的LLM无法依赖屏幕抓取(screen scraping);它需要一个可编程接口。这一转变将API从被动的数据管道转变为主动的执行层。对于开发者而言,这意味着要为可组合性(composability)而构建——你的服务必须能被AI调用,而不仅仅是人类。对于平台来说,这是一场战略性的重新定位。

技术深度解析

第二波API开放并非2011年时代的简单重演。其核心技术驱动力是LLM作为推理引擎的出现,这些引擎需要外部工具来与世界交互。这一能力由一种新的架构模式实现:函数调用(function-calling)工具使用(tool-use)范式。

在最简单的形式中,LLM会获得一个可用API函数的列表,每个函数都由一个JSON schema(名称、参数、描述)描述。当模型判断用户的请求需要执行某个操作时(例如“预订一张去东京的机票”),它会输出一个结构化的JSON对象,指定要调用哪个函数以及使用哪些参数。宿主应用程序随后执行该API调用,并将结果返回给模型,模型将其整合到自己的响应中。这个循环——推理、调用、观察、响应——是代理化工作流的基础。

关键技术组件:

1. 函数调用API: OpenAI的GPT-4o、Anthropic的Claude 3.5以及Google的Gemini都原生支持函数调用。模型经过训练,能够输出用于工具调用的结构化JSON。函数schema的质量(清晰的描述、精确的参数类型)直接影响模型的准确性。

2. 代理编排框架: LangChain、AutoGPT和Microsoft的Semantic Kernel等框架提供了管理多步骤代理循环的脚手架,包括记忆、规划和错误处理。开源仓库LangChain(GitHub上超过10万星标)是最流行的,提供了与数百个API和工具的集成。另一个值得注意的仓库是CrewAI(超过2.5万星标),专注于多代理协作。

3. API标准化: OpenAPI规范(前身为Swagger)正在成为描述RESTful API的事实标准。OpenAPI-to-GraphQLAPIMatic等工具有助于将遗留API转换为LLM更容易消费的格式。关键挑战在于,许多现有API是为人类开发者设计的,而非机器代理——它们缺乏清晰、无歧义的文档和一致的错误处理。

4. 身份验证与授权: OAuth 2.0仍然是标准,但代理化工作流带来了新的挑战。AI代理可能需要代表用户执行多个步骤,这需要长期有效的令牌或委托授权。Auth0Okta等服务正在开发针对代理的身份验证流程。

基准数据:函数调用准确率

| 模型 | 函数调用准确率(简单) | 函数调用准确率(复杂) | 平均延迟(每次调用) |
|---|---|---|---|
| GPT-4o | 94.2% | 82.1% | 1.2s |
| Claude 3.5 Sonnet | 93.8% | 80.5% | 1.5s |
| Gemini 1.5 Pro | 91.5% | 76.3% | 1.8s |
| Llama 3 70B(本地) | 87.1% | 68.9% | 3.4s |

数据要点: 虽然前沿模型在简单函数调用上实现了高准确率,但在复杂的多步骤工作流中(例如预订一张需要检查多个日期并比较价格的机票),性能仍然显著下降。延迟也是一个关键因素——每次API调用都会增加一次往返延迟,使得实时代理化应用面临挑战。

关键玩家与案例研究

第二波浪潮由一批正在重新思考API战略的成熟平台和初创公司共同推动。

1. OpenAI与ChatGPT插件生态系统(现已弃用但影响深远)

OpenAI于2023年3月推出的ChatGPT插件,是创建代理化API市场的首次重大尝试。开发者可以将自己的API注册为插件,ChatGPT会在相关时自动调用它们。尽管插件系统在2024年4月被弃用,转而支持GPT Store和原生函数调用,但它证明了这一概念的可行性。ExpediaKayakZapier等服务见证了来自AI代理的数百万次API调用。关键教训是:API必须为零样本发现(zero-shot discovery)而设计——模型必须无需人工干预就能理解API的功能。

2. Zapier的AI驱动自动化

无代码自动化之王Zapier已全力转向AI。其Zapier Central产品允许用户创建连接到其现有API集成的超过6000个应用的AI代理。Zapier的优势在于其庞大的预构建连接器库,每个连接器都带有清晰的操作schema。该公司报告称,AI触发的自动化现在占每月新创建的Zap的20%以上。

3. Stripe的API优先方法

Stripe长期以来一直是API设计的黄金标准。其支付API现在正被AI代理用于发票开具、订阅管理和欺诈检测等任务。Stripe的Stripe Connect平台尤其相关,因为它允许代理代表用户处理市场支付。该公司已发布构建“代理友好型”API的最佳实践,强调幂等键(idempotency keys)、清晰的错误消息和分页。

4. Notion的AI集成

Notion已开放其API,允许AI代理创建、编辑和检索笔记、数据库和文档。其Notion AI功能利用LLM进行内容生成和摘要,而API则使外部代理能够以编程方式与Notion工作空间交互。例如,一个AI代理可以自动从电子邮件中提取行动项并在Notion中创建任务。Notion的API设计强调简洁性和一致性,使其成为代理化工作流的理想目标。

5. Shopify的代理化商务

Shopify正在探索允许AI代理代表商家执行操作的API,包括订单管理、库存更新和客户支持。其Shopify FunctionsShopify Flow产品为代理化自动化提供了基础。该公司已与多个AI代理平台合作,以启用语音下单和自动退货处理等用例。

对开发者的影响

第二波API开放对开发者意味着根本性的转变:

- 从人为中心到代理为中心的设计: API文档必须针对机器可读性进行优化。清晰的JSON schema、一致的错误代码和幂等性不再是可选项,而是必需品。
- 可组合性优先: 你的API必须能够被编排到多步骤工作流中。这意味着支持批量操作、异步回调以及部分失败时的优雅降级。
- 速率限制的新范式: 代理可能比人类用户发出更多请求,但模式不同——它们可能在高活动爆发后长时间闲置。基于令牌桶的速率限制比简单的每分钟请求数限制更合适。
- 调试与可观测性: 当AI代理调用你的API时,调试变得复杂。提供详细的日志、追踪ID和沙盒环境对于代理开发者至关重要。

风险与挑战

第二波API开放并非没有风险:

- 安全与滥用: 恶意行为者可能利用AI代理进行大规模攻击,如凭证填充、数据抓取或欺诈性交易。API提供商必须实施强大的速率限制、异常检测和行为分析。
- 责任问题: 当AI代理代表用户执行操作时,谁对错误负责?如果代理预订了错误的航班或发送了不适当的电子邮件,责任归属尚不明确。
- 锁定效应: 随着代理变得依赖特定API,平台可能获得前所未有的议价能力。开放标准(如OpenAPI)和可移植的代理框架对于防止锁定至关重要。
- 隐私与数据治理: AI代理可能跨多个API传递敏感用户数据,增加了数据泄露和合规风险。数据本地化和同意管理成为关键问题。

未来展望

第二波API开放仍处于早期阶段,但轨迹是清晰的:在未来两到三年内,大多数主要平台将提供针对AI代理优化的API。我们将看到:

- API市场的复兴: 类似于2011年的应用市场,但这次是代理市场,AI代理可以动态发现和订阅API。
- 代理原生API设计模式: 新的API设计模式将出现,专门针对代理化工作流优化,例如支持状态管理、长运行操作和条件逻辑。
- 监管压力: 随着AI代理在经济中扮演更重要角色,监管机构将关注API访问的公平性、透明度和安全性。
- 人机协作的新范式: 最终,第二波API开放将模糊人与机器之间的界限。用户将不再直接与API交互,而是通过AI代理作为中介,这些代理代表用户协调多个服务。

对于开发者来说,信息是明确的:现在就开始为代理化世界构建。审查你的API文档,确保你的schema清晰且机器可读,并考虑你的服务如何融入多步骤代理工作流。第二波API开放不会等待任何人。

相关专题

AI agents600 篇相关文章

时间归档

April 20262290 篇已发布文章

延伸阅读

算力贵族:AI如何重写经济不平等人工智能常被包装为民主化力量,但其底层结构动力却指向相反的轨迹。与以往标准化消费体验的技术浪潮不同,AI正基于计算能力和数据访问权限,构建新的社会分层。数据饥荒:AI的“文字饥渴”如何威胁下一代智能大语言模型的爆发式增长掩盖了一个根本性脆弱点:它们对数据的无尽渴求正在迅速耗尽全球可用的高质量文本。这场迫在眉睫的“数据饥荒”可能使AI发展陷入停滞,迫使我们从根本上重新思考如何构建智能系统。一场寻找新数据源、创造更高效架构的竞赛已然拉开序字节跳动的静默AI革命:Seed 2.0与TRAE如何将技能开发民主化当其他AI巨头竞逐头条时,字节跳动正悄然构建一个强大的全栈AI生态。近期推出的Seed 2.0模型家族与TRAE开发工具链,标志着其通过提供强大、集成且关键是完全免费的AI“技能”构建平台,向开发者赋能的战略布局。AI增强型工作者:人机混合体如何破解自动化的“最后一公里”难题Waymo自动驾驶出租车遭遇了一个颇具“人性”的困扰:乘客忘记关车门。这个简单的故障揭示了追求完全自动化过程中的根本缺陷。正在浮现的解决方案并非更复杂的AI,而是战略性地回归“人在回路”系统,由此催生出一类新型的AI增强型工作者。

常见问题

这次模型发布“Second Wave of API Openness: Why AI Agents Are Driving a New Platform Revolution”的核心内容是什么?

The first API wave, circa 2011, saw platforms like Facebook and Twitter open their data feeds, spawning a generation of social apps and mashups. That era ended in walled gardens an…

从“How to design APIs for AI agent consumption”看,这个模型发布为什么重要?

The second wave of API openness is not a simple rehash of the 2011 era. The core technical driver is the emergence of LLMs as reasoning engines that require external tools to interact with the world. This is enabled by a…

围绕“Best practices for function calling with LLMs”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。