技术深度剖析
HTTPS 对于 AI Agent 而言存在固有的低效性,这源于其设计哲学:通过复杂的握手实现“信任但验证”,并为视觉保真度渲染所有内容。当 AI Agent 通过 HTTPS 请求资源时,它会发起 TCP 连接,随后是 TLS 握手,涉及多次往返以进行密钥交换和证书验证。一旦建立安全通道,HTTP 协议会添加内容类型、编码、缓存策略和 Cookie 的头部信息。服务器通常响应 laden dengan 语义标签、CSS 类和 JavaScript bundles 的 HTML,必须下载并执行这些内容才能揭示实际内容。对于 Large Language Model 而言,这是浪费。模型不需要渲染下拉菜单或通过 Cookie 跟踪用户会话。它需要纯粹的语义文本。
相比之下,Gemini 等协议 operates on 更简单的信任模型和数据结构。Gemini 使用自签名证书模型,消除了握手期间对集中式 Certificate Authority 验证的需求,减少了连接建立时间。该协议是严格类型的,区分文本、输入字段和文件,没有 HTML 标签的歧义。这种结构允许 parsers 使用确定性 regular expressions 提取信息,而不是概率性的 DOM 遍历。开源实现如 `gemini-python` 库展示了 client 相比沉重的 HTTP stacks 建立连接和检索 payload 的速度有多快。此外, absence of JavaScript execution 移除了一整类称为 Cross-Site Scripting (XSS) 的计算开销和安全漏洞。
优化 Agent 延迟的工程团队也在重新审视 raw TCP sockets 或 Unix domain sockets 用于本地 Agent 到 Agent 的通信,在可能的情况下完全 bypass 网络栈。payload 大小的减少是显著的。包含新闻文章的 HTTPS 响应可能包括 200KB 的 HTML、CSS 和 JS 来交付 5KB 的实际文本。Gemini 或纯文本响应直接交付 5KB。这种 40 倍的数据传输减少直接 correlates 到按 token volume 收费的 AI 系统的更低 ingestion 成本。
| 协议 | 握手轮次 | 平均 Payload 开销 | 解析复杂度 | 安全模型 |
|---|---|---|---|---|
| HTTPS (HTTP/2) | 2-3 (TLS + TCP) | 高 (Headers + Cookies) | 高 (DOM + JS) | 集中式 CA |
| Gemini | 1 (简单 TLS) | 最小 (类型代码) | 低 (基于行) | 自签名 TOFU |
| Gopher | 1 (TCP) | 无 | 非常低 (菜单) | 无/可选 |
数据要点:Gemini 协议通过消除集中式证书验证和不必要的元数据,减少了握手复杂性和 payload 开销,与标准 HTTPS 相比,为机器间数据检索提供了显著更快且更便宜的替代方案。
关键参与者与案例研究
向轻量级协议的转变是由基础设施提供商和注重隐私的开发社区驱动的,而不是传统的 Web 巨头。几家 AI 基础设施初创公司现在提供完全 bypass 标准 Web 服务器的“agent-native”端点。这些平台提供返回结构化文本或二进制数据的 APIs,没有 HTTP 包装器,专为自主工作流消费设计。在开源领域,像 `Lagrange` 这样的桌面 Gemini 客户端项目看到了构建 Agent 接口的开发者的 renewed interest。这些工具不仅仅是 browsers,而是作为 Agent 应如何与信息 servers 交互的 reference implementations。
私营企业网络也在 leading 这一过渡。大型科技公司正在部署内部 Agent 网络,通过专有 binary 协议而不是 REST over HTTP 进行通信。这允许在 Agent 协调任务的 microservices 架构中实现更高的 throughput 和更低的 latency。例如,内部 orchestration 工具正从 JSON-over-HTTP 转向 Protocol Buffers over gRPC 甚至更简单的 custom TCP streams,以最小化 serialization 成本。这一趋势 mirrors 高频交易部门从标准网络转向专用线路的举动,但应用于信息检索。
内容提供商开始 experiment 与 dual-stack 交付。一些技术文档站点现在提供“机器模式”,除了传统 HTML 视图外,还提供 raw markdown 或 Gemini 格式。这允许 Agents 抓取信息而不触发为人类 browsers 设计的 rate limits。该策略显著减少了 server load,因为 serving 文本比 rendering 动态页面需要的 CPU cycles 少得多。采用这种方法的公司报告 bandwidth 成本下降和 Agent 成功率提高,因为 scraper 被设计为 JavaScript challenges 的 anti-bot 措施 block 的机会更少。
| 解决方案类型 | 目标用户 | 协议 | 延迟 |
|---|---|---|---|
| 传统 Web | 人类 | HTTPS | 高 |
| Agent 原生 | 机器 | Gemini/TCP | 低 |