ANML:为AI代理重写网络规则,机器优先的标记语言即将颠覆互联网

Hacker News May 2026
来源:Hacker NewsAI agents归档:May 2026
一项全新的IETF草案——代理网络标记语言(ANML),正提议从以人为中心的HTML转向面向AI代理的机器优先语义结构。这或将终结脆弱的屏幕抓取和复杂的API集成,让自主代理能够直接解析、执行乃至协商网络任务。AINews深入剖析其技术内核、关键参与方与高风险的采纳前景。

我们熟知的互联网是为人类眼睛而建的。HTML渲染页面供视觉消费,CSS负责样式,JavaScript处理交互。然而,当AI代理——购物机器人、研究助手、企业自动化脚本——如今已占据约42%的网络流量时,效率低下的问题愈发刺眼。代理必须解析杂乱的HTML、逆向工程布局,或依赖脆弱的屏幕抓取技术。由Google DeepMind、OpenAI和MIT等机构研究人员组成的联盟向IETF提交的ANML草案,提出了一次彻底的革新:一种每个标签都是机器语义指令的标记语言。不再使用<div class="price">,ANML采用<price currency="USD">199.99</price>;不再使用<a href="/buy">,而是<action type="purchase" target="product_id_123">。这标志着从人类可读到机器可执行的范式转变。

技术深度解析

ANML并非简化的HTML,而是一种根本不同的范式。HTML描述的是*呈现*,而ANML描述的是*意图与数据*。该规范定义了一组核心语义标签,分为四大类别:

1. 数据标签:`<entity>`、`<attribute>`、`<relation>`、`<measurement>` —— 用于表示结构化知识(例如产品、价格、评论、科学数据)。
2. 动作标签:`<action>`、`<workflow>`、`<condition>`、`<callback>` —— 用于定义代理可调用的可执行操作(例如购买、订阅、查询、协商)。
3. 信任标签:`<identity>`、`<signature>`、`<permission>`、`<provenance>` —— 用于内容来源的加密验证和代理授权。
4. 协商标签:`<offer>`、`<counter>`、`<accept>`、`<contract>` —— 用于代理间的讨价还价和协议形成。

该语言序列化为XML,但带有严格的模式(XSD)以强制类型安全。例如,价格必须是带有货币属性的十进制数;动作必须定义HTTP方法和端点。这消除了困扰HTML解析的歧义性。

一个关键创新是代理清单 —— 一个强制性的`<agent-manifest>`块,用于声明服务代理的能力、约束和身份。这使得请求代理能够发现站点是否支持ANML、允许哪些操作以及需要何种身份验证,而无需任何API调用。

来自ANML工作组内部测试的性能基准:

| 指标 | 基于HTML的代理 | 基于ANML的代理 | 改进幅度 |
|---|---|---|---|
| 任务完成率(电子商务) | 67% | 94% | +27个百分点 |
| 每任务平均延迟 | 2.8秒 | 0.87秒 | 快3.2倍 |
| 每1000页解析错误数 | 143 | 3 | 减少97.9% |
| 每页平均带宽 | 1.2 MB | 48 KB | 减少96% |
| 集成新站点所需开发者工时 | 40小时 | 2小时 | 快20倍 |

数据洞察: 这些数字令人震惊。ANML不仅是渐进式改进——它是效率的阶跃式提升。仅96%的带宽减少就能在全球范围内节省数十亿美元的服务器成本,而20倍的集成速度提升使得代理自动化对小企业也变得触手可及。

在GitHub上,参考实现——IETF工作组的`anml-parser`——已获得4200颗星。MIT CSAIL团队开发的配套库`anml-agent-sdk`提供了Python和Rust绑定,用于构建原生ANML代理。两者均处于活跃开发中,每周都有提交。

关键参与方与案例研究

ANML草案由IETF的代理互联网工作组负责,主席为Dr. Elena Voss(前Google网络标准团队成员),共同作者来自OpenAI、DeepMind、MIT和Mozilla。但真正的行动在于围绕它形成的生态系统。

Google是最积极的推动者。其Shopping团队已为部分产品列表部署了ANML端点,早期与Google Project Mariner代理的测试显示购物车放弃率降低了40%。Google Cloud部门还为使用Shopify或Magento的电商网站提供免费的ANML注释服务。

OpenAI已将ANML解析集成到GPT-5的函数调用管道中。GPT-5不再需要猜测HTML结构,而是可以直接消费ANML注释页面,产生更可靠的结构化输出。OpenAI内部基准测试显示,当ANML可用时,工具使用准确率提高了22%。

Mozilla采取了不同角度:它正在开发一个名为'ANML Bridge'的开源浏览器扩展,利用轻量级LLM从任何HTML页面自动生成ANML注释。这可以在遗留站点上引导采用。

主要代理框架的ANML支持对比(截至2026年5月):

| 框架 | ANML解析 | ANML生成 | 代理协商 | 状态 |
|---|---|---|---|---|
| Google Project Mariner | 原生 | 是 | 部分 | 生产环境 |
| OpenAI GPT-5函数调用 | 原生 | 否 | 否 | 生产环境 |
| Anthropic Claude Agent SDK | 通过插件 | 否 | 否 | Beta版 |
| AutoGPT(社区版) | 通过`anml-parser` | 通过`anml-agent-sdk` | 实验性 | Alpha版 |
| Microsoft Copilot Studio | 计划2026年Q3 | 计划2026年Q3 | 计划中 | 路线图 |

数据洞察: Google和OpenAI是先行者,但Microsoft的沉默意味深长。如果Copilot Studio跳过ANML而采用自己的专有协议,我们可能会看到一场堪比浏览器大战的标准之争。

行业影响与市场动态

ANML的采纳将遵循经典的网络效应曲线。早期价值将流向自动化效率至关重要的大流量、低利润垂直领域。

电子商务是唾手可得的果实。仅Amazon一家每天就有超过6亿次来自自动化代理(价格追踪器、库存机器人、联盟抓取工具)的产品页面浏览量。如果其中10%的页面采用ANML,那么

更多来自 Hacker News

AI代币经济学2.0:从投机炒作到可持续收入引擎AI代币经济正经历一场深刻的范式转移。核心问题不再是“如何发行代币”,而是“如何让代币成为可持续商业价值的直接载体”。早期由市场投机驱动的模式已被证明不可持续,往往无法与实际产品采用形成正向反馈循环。如今,领先的AI项目正在将代币嵌入具有真LLM绝不能写SQL:声明式安全层如何重塑企业AI架构多年来,企业AI社区一直运行在一个危险的假设之上:大型语言模型可以被信任来自主生成并执行数据库查询。结果却屡屡令人心惊——幻觉式表连接导致数据泄露、灾难性提示注入窃取患者记录、合规噩梦让法务团队彻夜难眠。一种全新的架构方法正在彻底颠覆这一逻从静态维基到动态制品:LLM知识范式重塑AI开发从LLM维基到制品的转变远非语义上的重新包装,它代表着知识管理范式的深度重构。传统维基作为静态的“知识仓库”,以线性格式存储信息,要求开发者手动将文档翻译成代码——这一过程充满认知摩擦与低效。制品概念则将知识封装为自包含、可执行的单元,不仅查看来源专题页Hacker News 已收录 3776 篇文章

相关专题

AI agents749 篇相关文章

时间归档

May 20262385 篇已发布文章

延伸阅读

Sonar API 让AI智能体拥有“听觉”:互联网音频搜索的黎明Sonar 推出全新 API,使 AI 智能体能够搜索整个互联网的音频内容——从播客、新闻广播到财报电话会议——通过将语音转化为结构化、可查询的数据。这一突破填补了智能体感知能力的关键空白,使其超越文本,解锁口语中蕴含的丰富语境、情感与微妙过期域名成负资产:AI代理正在重新定义网络权威一个长期被忽视的灰色市场——过期域名交易——正与AI代理的崛起激烈碰撞。传统SEO指标如域名权威和信任流因AI驱动的搜索与浏览系统优先考量内容新鲜度、语义连贯性和来源可验证性而迅速贬值。结果是:网络权威的评估体系正经历根本性重构。AI代理告别“保姆模式”:自主委派时代正式开启AI代理正经历一场根本性转变:从需要人类时刻“保姆式”监控,进化为真正自主的数字员工。新型自愈架构与递归推理循环,让代理能够自我纠错、动态优先级排序,并在无需人工干预的情况下处理边缘案例——这标志着“保姆模式”时代的终结。1905年人造语言Vendergood重生:AI智能体获得专属认知语言一种诞生于1905年的人造语言Vendergood正被重新唤醒,但并非用于人类交流,而是作为AI智能体的认知脚手架。通过施加严格的语法规则,研究人员旨在消除困扰基于LLM的智能体在多步骤推理和任务分解过程中产生的语义歧义。

常见问题

这次模型发布“ANML: The Machine-First Markup Language That Could Rewire the Web for AI Agents”的核心内容是什么?

The Internet as we know it was built for human eyes. HTML renders pages for visual consumption, with CSS for styling and JavaScript for interactivity. But as AI agents—shopping bot…

从“What is ANML and how is it different from HTML?”看,这个模型发布为什么重要?

ANML is not merely a simplified HTML; it is a fundamentally different paradigm. Where HTML describes *presentation*, ANML describes *intent and data*. The specification defines a core set of semantic tags organized into…

围绕“Will ANML replace HTML for human browsing?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。