后 Web 时代：AI Agent 弃用 HTTPS 转向轻量级协议

支撑人工智能的数字基础设施正在经历一场静默却深刻的转型，这场变革虽未大张旗鼓，却影响深远。随着自主 Agent 成为在线信息的主要消费者，专为人类视觉消费设计的现代 Web 遗留架构正日益显得过时，无法适应自动化流程的高吞吐要求。沉重的 JavaScript 框架、复杂的 DOM 结构和无处不在的广告追踪器引入了显著的延迟和计算开销，严重阻碍了 Agent 的运行效率。行业工程团队正越来越多地转向 Gemini 和 Gopher 等轻量级协议，这些协议剥离了冗余层，以促进直接的机器间通信，实现更高效的数据交换。这种架构上的不匹配导致了资源浪费，迫使技术社区寻找替代方案。新的协议栈旨在消除不必要的握手和渲染过程，从而大幅降低运营成本。这一转变不仅仅是优化调整，而是针对非人类用户定制的互联网协议栈的根本性重构，标志着 Web 交互模式的范式转移。

技术深度剖析

HTTPS 对于 AI Agent 而言存在固有的低效性，这源于其设计哲学：通过复杂的握手实现“信任但验证”，并为视觉保真度渲染所有内容。当 AI Agent 通过 HTTPS 请求资源时，它会发起 TCP 连接，随后是 TLS 握手，涉及多次往返以进行密钥交换和证书验证。一旦建立安全通道，HTTP 协议会添加内容类型、编码、缓存策略和 Cookie 的头部信息。服务器通常响应 laden dengan 语义标签、CSS 类和 JavaScript bundles 的 HTML，必须下载并执行这些内容才能揭示实际内容。对于 Large Language Model 而言，这是浪费。模型不需要渲染下拉菜单或通过 Cookie 跟踪用户会话。它需要纯粹的语义文本。

相比之下，Gemini 等协议 operates on 更简单的信任模型和数据结构。Gemini 使用自签名证书模型，消除了握手期间对集中式 Certificate Authority 验证的需求，减少了连接建立时间。该协议是严格类型的，区分文本、输入字段和文件，没有 HTML 标签的歧义。这种结构允许 parsers 使用确定性 regular expressions 提取信息，而不是概率性的 DOM 遍历。开源实现如 `gemini-python` 库展示了 client 相比沉重的 HTTP stacks 建立连接和检索 payload 的速度有多快。此外， absence of JavaScript execution 移除了一整类称为 Cross-Site Scripting (XSS) 的计算开销和安全漏洞。

优化 Agent 延迟的工程团队也在重新审视 raw TCP sockets 或 Unix domain sockets 用于本地 Agent 到 Agent 的通信，在可能的情况下完全 bypass 网络栈。payload 大小的减少是显著的。包含新闻文章的 HTTPS 响应可能包括 200KB 的 HTML、CSS 和 JS 来交付 5KB 的实际文本。Gemini 或纯文本响应直接交付 5KB。这种 40 倍的数据传输减少直接 correlates 到按 token volume 收费的 AI 系统的更低 ingestion 成本。

| 协议 | 握手轮次 | 平均 Payload 开销 | 解析复杂度 | 安全模型 |
|---|---|---|---|---|
| HTTPS (HTTP/2) | 2-3 (TLS + TCP) | 高 (Headers + Cookies) | 高 (DOM + JS) | 集中式 CA |
| Gemini | 1 (简单 TLS) | 最小 (类型代码) | 低 (基于行) | 自签名 TOFU |
| Gopher | 1 (TCP) | 无 | 非常低 (菜单) | 无/可选 |

数据要点：Gemini 协议通过消除集中式证书验证和不必要的元数据，减少了握手复杂性和 payload 开销，与标准 HTTPS 相比，为机器间数据检索提供了显著更快且更便宜的替代方案。

关键参与者与案例研究

向轻量级协议的转变是由基础设施提供商和注重隐私的开发社区驱动的，而不是传统的 Web 巨头。几家 AI 基础设施初创公司现在提供完全 bypass 标准 Web 服务器的“agent-native”端点。这些平台提供返回结构化文本或二进制数据的 APIs，没有 HTTP 包装器，专为自主工作流消费设计。在开源领域，像 `Lagrange` 这样的桌面 Gemini 客户端项目看到了构建 Agent 接口的开发者的 renewed interest。这些工具不仅仅是 browsers，而是作为 Agent 应如何与信息 servers 交互的 reference implementations。

私营企业网络也在 leading 这一过渡。大型科技公司正在部署内部 Agent 网络，通过专有 binary 协议而不是 REST over HTTP 进行通信。这允许在 Agent 协调任务的 microservices 架构中实现更高的 throughput 和更低的 latency。例如，内部 orchestration 工具正从 JSON-over-HTTP 转向 Protocol Buffers over gRPC 甚至更简单的 custom TCP streams，以最小化 serialization 成本。这一趋势 mirrors 高频交易部门从标准网络转向专用线路的举动，但应用于信息检索。

内容提供商开始 experiment 与 dual-stack 交付。一些技术文档站点现在提供“机器模式”，除了传统 HTML 视图外，还提供 raw markdown 或 Gemini 格式。这允许 Agents 抓取信息而不触发为人类 browsers 设计的 rate limits。该策略显著减少了 server load，因为 serving 文本比 rendering 动态页面需要的 CPU cycles 少得多。采用这种方法的公司报告 bandwidth 成本下降和 Agent 成功率提高，因为 scraper 被设计为 JavaScript challenges 的 anti-bot 措施 block 的机会更少。

| 解决方案类型 | 目标用户 | 协议 | 延迟 |
|---|---|---|---|
| 传统 Web | 人类 | HTTPS | 高 |
| Agent 原生 | 机器 | Gemini/TCP | 低 |

时间归档

延伸阅读

常见问题

这次模型发布“AI Agents Ditch HTTPS for Lightweight Protocols in PostWeb Era”的核心内容是什么？

The digital infrastructure underpinning artificial intelligence is undergoing a silent but profound transformation. As autonomous agents become the primary consumers of online info…

从“how AI agents reduce token costs”看，这个模型发布为什么重要？

The inefficiency of HTTPS for AI agents stems from its design philosophy: trust but verify through complex handshakes, and render everything for visual fidelity. When an AI agent requests a resource via HTTPS, it initiat…

围绕“Gemini protocol vs HTTPS for machines”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。