AI代理的盲区:为何服务发现亟需通用协议

Hacker News April 2026
来源:Hacker NewsAI agentsAI infrastructure归档:April 2026
AI代理正从数字助手演变为自主采购引擎,却遭遇了基础设施的根本性瓶颈。为人类视觉设计的万维网,缺乏一套供机器发现与购买服务的标准化可读语言。本文剖析了新兴的‘服务清单’协议,这项基础性创新或将催生一个专为代理优化的互联网新层级。

AI代理的迅猛发展,暴露了我们数字基础设施中的一个关键缺陷。尽管大语言模型能够解析文本,工具调用框架可以执行操作,但目前仍不存在一种通用协议,能让代理自主地发现、比较并交易现实世界中的服务。这一空白正成为主要瓶颈,阻碍代理从简单的任务自动化,进化为能够处理复杂采购、物流协调与服务经纪的成熟经济主体。当前的方法迫使代理依赖于对人类导向网站的低效且脆弱的网络爬取,这一过程容易出错,且无法处理细致的服务等级协议、动态定价或可用性查询。由谷歌等巨头倡导的新兴解决方案,正指向一种结构化的‘服务清单’协议。该协议本质上是一种机器可读的文件,充当服务提供商与AI代理之间的数字握手。它详细描述了服务身份、功能、定价模型、API交互方式以及可组合性。这种标准化格式将使代理能够进行语义匹配、跨供应商优化,并执行安全的自动化交易,从而将代理的能力从信息检索提升至真正的经济协调。这预示着互联网将从当前的‘呈现层’向‘意图层’演进,为机器对机器经济奠定基础,其影响可能不亚于HTTP协议之于人类信息访问的革命。

技术深度解析

核心的技术挑战在于创建一种协议,它既要足够强大以捕捉现实世界服务的复杂性,又要足够简单以实现广泛采用。领先的概念模型是 结构化服务清单,这是一种机器可读的文件,充当服务提供商与AI代理之间的数字握手。

架构与规范:
一个健壮的清单很可能使用如JSON Schema或OpenAPI这样的模式语言来定义,以确保可验证性和互操作性。其结构必须包含几个关键层次:
1. 身份与认证: 数字签名、API密钥、OAuth端点以及提供商验证凭证。
2. 服务描述: 服务的分层分类法(例如 `cloud.compute.gpu.a100`)、自然语言描述以及机器可解释的能力标签。
3. 定价与SLA模型: 结构化定价表(按单位、订阅、分层)、保证正常运行时间百分比、延迟界限以及惩罚条款。
4. 交互协议: 实际的API端点(REST、GraphQL、gRPC)、其规范(OpenAPI/Swagger)以及支持的动作原语(例如 `reserve`、`purchase`、`query_status`)。
5. 可组合性钩子: 指示此服务如何与其他服务链接的元数据,包括输入/输出数据格式和依赖声明。

算法挑战:
对于代理而言,任务从解析HTML转变为 语义服务匹配与优化。这涉及:
- 清单的向量嵌入: 将结构化服务描述转换为嵌入向量,可实现相似性搜索。寻找“视频编辑”的代理可以通过向量邻近度找到相关服务,如“动态图形”或“色彩校正”。
- 约束满足与多属性效用优化: 代理必须解决复杂的优化问题,在多个提供商之间平衡成本、SLA、质量评级和交付时间。谷歌的 OR-Tools 或开源求解器等框架将被集成到代理的推理循环中。
- 信任与验证图谱: 代理需要评估提供商的可靠性。这可能涉及链上声誉系统(使用智能合约记录SLA合规情况)或联合信任评分。

开源基础:
多个GitHub仓库正在开创相关概念。谷歌的 `ServiceWeaver` 是一个将分布式应用程序编写为单一模块化二进制文件的框架,其编译器负责处理部署。其声明式服务组合的理念与清单的理想模型高度契合。另一个相关项目是Spotify的 `Backstage`,这是一个用于构建开发者门户的开源平台,可编录软件组件及其所有权——这是组织内部服务发现的原始形式。缺失的部分是一个公开的、跨公司的标准。

| 协议层 | 人类网络(当前) | 代理优化网络(提议) |
|---|---|---|
| 发现 | 搜索引擎(Google)、目录(Yelp) | 清单注册中心、分布式哈希表(DHTs) |
| 数据格式 | HTML、非结构化文本 | 结构化YAML/JSON清单(例如 `.service.yaml`) |
| 查询方式 | 关键词搜索、浏览 | 语义向量搜索、基于约束的查询 |
| 交易 | 结账表单、支付网关 | 带有标准化认证和支付令牌的API调用 |
| 验证 | 用户评论、信任印章 | 加密签名、链上SLA日志、代理审计追踪 |

数据启示: 上表突显了从呈现层网络到意图层网络的范式转变。提议的技术栈从根本上对机器更高效,将模糊的解释任务转变为精确的数据检索和优化问题,有可能将代理交易延迟降低数个数量级。

关键参与者与案例研究

定义这一协议的竞赛涉及从云巨头到雄心勃勃的初创公司在内的多元参与者。

具有战略利益的现有巨头:
- 谷歌与Alphabet: 凭借DeepMind的 Gemini 代理和 Vertex AI 平台,谷歌对能够无缝编排服务——尤其是谷歌云服务——的代理有着既得利益。他们在 Knative(用于无服务器工作负载)和 Apigee(API管理)方面的工作提供了基础构件。一个通用清单将极大提升其代理生态系统的效用。
- 微软: 通过 Azure AI 及其对OpenAI的深度投资,微软正将Copilot定位为数字和物理工作流程的协调者。其 Power Platform 连接了数百项服务,是更通用系统的先驱。微软可以倡导一个清单标准,使Azure成为代理发现服务的首选后端。
- 亚马逊: AWS的 Bedrock 代理框架已经允许创建使用AWS服务的机器人。亚马逊对标准化服务接口的兴趣在于巩固其市场地位,并使其庞大的AWS服务目录更易于被自主代理发现和利用。

更多来自 Hacker News

多智能体 AI 系统革命性重塑自动化漏洞发现格局网络安全格局正经历由多智能体大语言模型系统驱动的根本性变革。传统的漏洞扫描严重依赖静态签名和基于规则的引擎,往往产生高误报率,需要大量人工分类并延误修复工作,导致安全团队负担过重且响应滞后。新兴范式引入了协作式 AI 智能体,战略性地在扫描Webflow 祭出“代理优先”架构,无代码 Web 开发迎来范式革命Webflow 正在执行一次基础设施的根本性 pivot,其战略重心已从视觉设计工具转向成为新兴代理经济的首要编排层。这一转型重新定义了网站的本质:从静态的展示层转变为动态的、机器可读的接口,具备自主协商交易的能力。通过直接将语义元数据嵌入后 Web 时代:AI Agent 弃用 HTTPS 转向轻量级协议支撑人工智能的数字基础设施正在经历一场静默却深刻的转型,这场变革虽未大张旗鼓,却影响深远。随着自主 Agent 成为在线信息的主要消费者,专为人类视觉消费设计的现代 Web 遗留架构正日益显得过时,无法适应自动化流程的高吞吐要求。沉重的 J查看来源专题页Hacker News 已收录 4054 篇文章

相关专题

AI agents789 篇相关文章AI infrastructure270 篇相关文章

时间归档

April 20263042 篇已发布文章

延伸阅读

AI Agent研究者散落四方:缺失的“中央广场”正拖慢创新步伐一位知名AI Agent研究者公开询问“同行都在哪”,暴露了一个刺眼的真空:与拥有Hugging Face的LLM生态不同,Agent开发者们分散在Discord服务器和各类小众论坛中。这种碎片化正成为隐形瓶颈,阻碍该领域从孤立实验迈向系统AI代理的隐性税:Token效率为何成为新战场AI代理的Token消耗量是标准聊天机器人的10到100倍,这一隐性成本危机正威胁着实际部署。AINews深入探讨新兴的Token优化工程学科及其催生的中间件市场。HTTP 402 复活:AI 代理在 Base 链上实现“自给自足”一项创新协议复活了沉寂已久的 HTTP 402“需要付款”状态码,让 AI 代理能够通过 Coinbase 的 Base 链,使用 USDC 自主支付 API 访问费用。这标志着 AI 服务从订阅制向按次付费经济的根本性转变,代理将实时自主AI代理需要新型托管:为机器商业打造可编程信任当AI代理开始自主执行真实世界的支付与合约时,传统依赖人类判断与信任的托管系统已根本失效。一种全新的可编程托管架构正在崛起,专为需要确定性逻辑与密码学证明的机器间交易而设计。

常见问题

这次模型发布“The AI Agent Blind Spot: Why Service Discovery Needs a Universal Protocol”的核心内容是什么?

The rapid advancement of AI agents has exposed a critical deficiency in our digital infrastructure. While large language models can parse text and tool-calling frameworks can execu…

从“What is a service manifest for AI agents?”看,这个模型发布为什么重要?

The core technical challenge is creating a protocol that is both expressive enough to capture the complexity of real-world services and simple enough to be universally adopted. The leading conceptual model is a Structure…

围绕“How will AI agents book flights without a website?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。