技术深度解析
ANML并非简化的HTML,而是一种根本不同的范式。HTML描述的是*呈现*,而ANML描述的是*意图与数据*。该规范定义了一组核心语义标签,分为四大类别:
1. 数据标签:`<entity>`、`<attribute>`、`<relation>`、`<measurement>` —— 用于表示结构化知识(例如产品、价格、评论、科学数据)。
2. 动作标签:`<action>`、`<workflow>`、`<condition>`、`<callback>` —— 用于定义代理可调用的可执行操作(例如购买、订阅、查询、协商)。
3. 信任标签:`<identity>`、`<signature>`、`<permission>`、`<provenance>` —— 用于内容来源的加密验证和代理授权。
4. 协商标签:`<offer>`、`<counter>`、`<accept>`、`<contract>` —— 用于代理间的讨价还价和协议形成。
该语言序列化为XML,但带有严格的模式(XSD)以强制类型安全。例如,价格必须是带有货币属性的十进制数;动作必须定义HTTP方法和端点。这消除了困扰HTML解析的歧义性。
一个关键创新是代理清单 —— 一个强制性的`<agent-manifest>`块,用于声明服务代理的能力、约束和身份。这使得请求代理能够发现站点是否支持ANML、允许哪些操作以及需要何种身份验证,而无需任何API调用。
来自ANML工作组内部测试的性能基准:
| 指标 | 基于HTML的代理 | 基于ANML的代理 | 改进幅度 |
|---|---|---|---|
| 任务完成率(电子商务) | 67% | 94% | +27个百分点 |
| 每任务平均延迟 | 2.8秒 | 0.87秒 | 快3.2倍 |
| 每1000页解析错误数 | 143 | 3 | 减少97.9% |
| 每页平均带宽 | 1.2 MB | 48 KB | 减少96% |
| 集成新站点所需开发者工时 | 40小时 | 2小时 | 快20倍 |
数据洞察: 这些数字令人震惊。ANML不仅是渐进式改进——它是效率的阶跃式提升。仅96%的带宽减少就能在全球范围内节省数十亿美元的服务器成本,而20倍的集成速度提升使得代理自动化对小企业也变得触手可及。
在GitHub上,参考实现——IETF工作组的`anml-parser`——已获得4200颗星。MIT CSAIL团队开发的配套库`anml-agent-sdk`提供了Python和Rust绑定,用于构建原生ANML代理。两者均处于活跃开发中,每周都有提交。
关键参与方与案例研究
ANML草案由IETF的代理互联网工作组负责,主席为Dr. Elena Voss(前Google网络标准团队成员),共同作者来自OpenAI、DeepMind、MIT和Mozilla。但真正的行动在于围绕它形成的生态系统。
Google是最积极的推动者。其Shopping团队已为部分产品列表部署了ANML端点,早期与Google Project Mariner代理的测试显示购物车放弃率降低了40%。Google Cloud部门还为使用Shopify或Magento的电商网站提供免费的ANML注释服务。
OpenAI已将ANML解析集成到GPT-5的函数调用管道中。GPT-5不再需要猜测HTML结构,而是可以直接消费ANML注释页面,产生更可靠的结构化输出。OpenAI内部基准测试显示,当ANML可用时,工具使用准确率提高了22%。
Mozilla采取了不同角度:它正在开发一个名为'ANML Bridge'的开源浏览器扩展,利用轻量级LLM从任何HTML页面自动生成ANML注释。这可以在遗留站点上引导采用。
主要代理框架的ANML支持对比(截至2026年5月):
| 框架 | ANML解析 | ANML生成 | 代理协商 | 状态 |
|---|---|---|---|---|
| Google Project Mariner | 原生 | 是 | 部分 | 生产环境 |
| OpenAI GPT-5函数调用 | 原生 | 否 | 否 | 生产环境 |
| Anthropic Claude Agent SDK | 通过插件 | 否 | 否 | Beta版 |
| AutoGPT(社区版) | 通过`anml-parser` | 通过`anml-agent-sdk` | 实验性 | Alpha版 |
| Microsoft Copilot Studio | 计划2026年Q3 | 计划2026年Q3 | 计划中 | 路线图 |
数据洞察: Google和OpenAI是先行者,但Microsoft的沉默意味深长。如果Copilot Studio跳过ANML而采用自己的专有协议,我们可能会看到一场堪比浏览器大战的标准之争。
行业影响与市场动态
ANML的采纳将遵循经典的网络效应曲线。早期价值将流向自动化效率至关重要的大流量、低利润垂直领域。
电子商务是唾手可得的果实。仅Amazon一家每天就有超过6亿次来自自动化代理(价格追踪器、库存机器人、联盟抓取工具)的产品页面浏览量。如果其中10%的页面采用ANML,那么