AI智能体需要新基础设施,而非更优API

Hacker News June 2026
来源:Hacker NewsAI agentsMCP protocolagent infrastructure归档:June 2026
AI智能体的最大瓶颈并非智能水平,而是通信能力。传统REST API和短信接口专为人类发起的查询设计,无法满足需要持久双向通道的自主智能体。一种基于事件驱动、AI原生协议(如模型上下文协议MCP)的新范式正在崛起,有望释放真正的智能体自主性并重塑经济格局。

AI智能体从对话助手向自主任务执行者的转型,正遭遇关键基础设施瓶颈。传统REST API和短信网关基于请求-响应模型运行,该模型针对人类交互优化:人类提问,服务器回答,然后连接关闭。对于执行多步骤工作流的智能体——例如预订航班、监控价格下跌并重新预订——这种模型迫使智能体不断轮询、重新建立连接并进行脆弱的状态管理。结果就是延迟、复杂性和成本低效,扼杀了许多智能体用例的可行性。AINews发现一场根本性转变正在发生:专为机器间对话设计的AI原生通信协议崛起。引领这一变革的是模型上下文协议(MCP)。

技术深度解析

REST API对智能体的核心问题在于架构层面。REST是无状态且同步的:每个请求必须包含所有必要上下文,客户端必须等待响应。对于执行“监控这只股票,当它下跌5%时执行交易”这类任务的智能体,这意味着每隔几秒轮询API、解析响应、检查条件并重复。这在带宽、计算和延迟上都是浪费。短信接口更糟——它们专为人类规模的一次性消息设计,没有会话管理。

新兴解决方案是事件驱动、持久连接架构,以模型上下文协议(MCP)为代表。MCP最初由Anthropic提出,现在作为开放标准获得关注,它定义了一个协议层,智能体和服务在其中维持长期存在的双向通道。智能体不再轮询,而是订阅特定事件(例如“AAPL股票价格变动”),服务在事件发生时推送更新。这类似于从HTTP/1.1迁移到WebSocket或gRPC流,但专门针对AI智能体工作流定制。

MCP的关键架构组件:
- 上下文通道: 持久连接,承载结构化消息(基于JSON),包含智能体状态、目标和历史的元数据。
- 事件订阅: 智能体声明对特定事件的兴趣;服务无需轮询即可推送通知。
- 动作处理器: 服务暴露智能体可调用的“动作”,带有结构化输入/输出模式,支持可组合性。
- 状态同步: 双方维护共享上下文窗口,允许智能体在断连后恢复工作流。

通信范式对比:

| 范式 | 延迟(平均) | 状态管理 | 可扩展性 | 智能体适用性 |
|---|---|---|---|---|
| REST API | 每次调用100-500ms | 无状态(按请求) | 高(无状态) | 差(需要轮询) |
| 短信/Webhook | 每条消息1-10s | 无状态(无会话) | 低 | 极差(面向人类) |
| WebSocket | 每条消息10-50ms | 有状态(按连接) | 中等 | 良好(持久) |
| MCP(事件驱动) | 每个事件5-20ms | 有状态(共享上下文) | 高(订阅模型) | 优秀(原生智能体) |

数据要点: 对于监控任务,MCP相比REST轮询将平均延迟降低10-50倍,并消除了重复认证和上下文重建的开销。这使得需要实时响应性的智能体工作流(例如交易、物流、客户支持升级)在技术和经济上变得可行。

在GitHub上,modelcontextprotocol/servers仓库已超过15,000颗星,提供Python和TypeScript参考实现。该协议设计为传输无关(可在WebSocket、HTTP/2甚至物联网的MQTT上运行),使其能够适应从云服务器到边缘设备的多样化环境。

要点: MCP不仅仅是一个协议——它是一个新的抽象层,将通信视为智能体架构中的一等公民。构建智能体系统的开发者现在就应该采用事件驱动模式,因为基于REST的方法将在12-18个月内成为竞争劣势。

关键参与者与案例研究

多家公司和开源项目已开始将这一范式转变付诸实践。最突出的是Anthropic,它提出了MCP并将其集成到Claude的企业产品中。Claude现在可以维持与数据库、CRM系统和物联网设备的持久连接,执行“监控库存水平并在低于阈值时自动重新订购”等工作流,无需人工干预。Anthropic声称,与基于REST的方法相比,多步骤工作流的任务完成时间减少了40%。

OpenAI并未止步。虽然他们没有直接采用MCP,但已推出带流式能力的函数调用,并据传正在内部开发专有的“智能体通信协议”(ACP)。他们的方法侧重于与Azure事件网格和服务总线的紧密集成,利用微软的云基础设施实现持久消息传递。

Google DeepMind正在探索不同角度:利用Gemini的长上下文窗口(高达200万token)将整个对话历史作为状态维护,减少对外部状态同步的需求。然而,这种方法内存密集,且未解决双向推送问题。

主要方法对比:

| 公司/项目 | 协议 | 关键优势 | 弱点 | 采用状态 |
|---|---|---|---|---|
| Anthropic(MCP) | 开放标准,事件驱动 | 真正双向,订阅模型 | 仍在成熟中,服务集成有限 | GitHub 15k+星,50+服务适配器 |
| OpenAI(函数调用+流式) | 专有,基于REST带流式 | 紧密Azure集成,庞大生态 | 非事件驱动,仍依赖轮询 | 广泛采用,但智能体原生性有限 |

更多来自 Hacker News

Token资本论:企业如何通过持续学习循环构建不可逾越的AI护城河企业AI领域正经历一场根本性的范式转移。最初的淘金热聚焦于获取最强大的基础模型或最大的静态数据集。然而,我们的编辑团队识别出一种更具战略性和防御性的资产:「Token资本」。这并非加密货币,而是由每一次用户交互——每一次提示、每一次AI响应Token-Warden:开源成本守护神,重塑企业AI经济账AINews发现了一款名为Token-Warden的开源工具,它正在悄然重塑企业AI部署的成本结构。就像一个一丝不苟的办公室经理,它实时监控、限制并智能路由Token消耗,在预算超支发生之前就将其扼杀在摇篮里。这项创新直接解决了将AI规模化苹果的静默革命:端侧AI模型重塑iPhone灵魂没有主题演讲,没有炫目演示,苹果悄然完成了可能是十年来最具战略意义的转型:将自研基础模型直接集成到iOS、iPadOS和macOS中。这些针对端侧推理优化的模型,如今正驱动着Siri响应、照片编辑和预测文本等核心功能——全程无需将用户数据上查看来源专题页Hacker News 已收录 4698 篇文章

相关专题

AI agents855 篇相关文章MCP protocol34 篇相关文章agent infrastructure37 篇相关文章

时间归档

June 20261402 篇已发布文章

延伸阅读

Sonar API 让AI智能体拥有“听觉”:互联网音频搜索的黎明Sonar 推出全新 API,使 AI 智能体能够搜索整个互联网的音频内容——从播客、新闻广播到财报电话会议——通过将语音转化为结构化、可查询的数据。这一突破填补了智能体感知能力的关键空白,使其超越文本,解锁口语中蕴含的丰富语境、情感与微妙OfficeOS:开源“AI智能体版Kubernetes”,让规模化部署不再遥不可及开源项目OfficeOS正试图攻克AI智能体领域最棘手的难题:如何在生产环境中管理数百个自主运行的智能体。通过提供任务调度、资源分配和错误恢复机制,它将自己定位为智能体时代的Kubernetes,标志着行业焦点正从“能否构建一个智能体”转向Spark CLI:本地邮件访问如何打破AI代理的收件箱围墙花园Spark团队推出的开源命令行工具Spark CLI,让AI代理能够从本地终端直接读写和管理多个邮件提供商(Gmail、Outlook等)的邮件。它绕过了传统API瓶颈和第三方中间件,将收件箱从被动存档转变为代理可访问的主动数据流——这是一Appctl:将文档一键转化为LLM工具,AI代理的“最后一公里”终于打通开源工具Appctl能自动将现有文档或数据库转化为可执行的MCP(模型上下文协议)工具,让任何大语言模型都能执行更新CRM记录、提交网页表单等真实操作。这一创新解决了AI代理的“最后一公里”难题,让它们从“空谈者”变成“实干家”。

常见问题

这次模型发布“AI Agents Need a New Infrastructure, Not Just Better APIs”的核心内容是什么?

The transition of AI agents from conversational assistants to autonomous task executors has hit a critical infrastructure wall. Traditional REST APIs and SMS gateways operate on a…

从“What is the Model Context Protocol (MCP) and how does it differ from REST APIs for AI agents?”看,这个模型发布为什么重要?

The core problem with REST APIs for agents is architectural. REST is stateless and synchronous: every request must contain all necessary context, and the client must wait for a response. For an agent performing a task li…

围绕“How does event-driven architecture improve AI agent performance and reduce costs?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。