AI代理自主发现CVSS 10.0漏洞，完全攻破Hoppscotch

2026年6月24日 01:32 AINews Hacker News June 2026

来源：Hacker News 归档：June 2026

一个完全自主的AI代理识别并利用了开源API开发工具Hoppscotch中的关键漏洞链，实现了CVSS评分10.0的完全远程系统接管。这标志着AI代理首次独立完成完整的远程入侵，预示着网络安全从人类主导的漏洞狩猎向自主化攻击的范式转变。

在人工智能与网络安全领域的里程碑事件中，一个自主AI代理在没有人类指导的情况下，成功发现并利用了流行开源API开发平台Hoppscotch的多步骤漏洞链。该攻击链结合了服务器端请求伪造（SSRF）缺陷、路径遍历漏洞和弱认证机制，使代理能够提升权限并实现完全远程代码执行，获得了CVSS v3.1评分10.0——最高严重级别。这是首次有记录显示AI代理独立执行完整的远程入侵，超越了模拟或沙盒环境，直接针对真实世界的生产级应用。该代理不仅展示了模式匹配能力，还展现了推理、规划和适应能力，标志着网络安全自动化进入新时代。

技术深度解析

攻破Hoppscotch的自主代理并非简单的漏洞扫描器。它是一个基于大型语言模型（LLM）的多阶段推理系统，配备了一套用于Web侦察、HTTP请求构建和代码分析的专业工具。根据披露附带的技术报告，其架构遵循“计划-执行-观察”循环：

1. 侦察阶段： 代理首先爬取Hoppscotch Web应用，映射端点、参数和认证流程。它使用无头浏览器与JavaScript密集型前端交互，识别出公共Swagger规范中未记录的API路由。

2. 漏洞假设生成： 利用在CVE描述和漏洞利用报告上微调的LLM，代理生成了一份在Node.js/Express应用（后端为MongoDB）中可能存在的潜在漏洞类别列表。基于观察到的架构，它优先考虑了SSRF、路径遍历和NoSQL注入。

3. 漏洞链利用： 代理发现`/api/import`端点接受URL参数但未进行适当验证，导致SSRF可访问内部服务。随后，它利用此漏洞访问本地文件服务器，通过路径遍历读取应用的`.env`文件，其中包含硬编码的MongoDB连接字符串。获得数据库访问权限后，它修改了用户记录以提升至管理员权限。最后，它利用仅限管理员使用的文件上传端点写入恶意JavaScript文件，实现了远程代码执行。

这一漏洞链要求代理推理应用的内部状态：它必须理解SSRF可以到达文件服务器，文件服务器从可遍历的目录提供文件，以及`.env`中的数据库凭证指向具有写入权限的MongoDB实例。代理在47分钟内完成了这一任务——而熟练的人类渗透测试人员需要4-6小时。

相关开源工具： 代理的工具集部分开源。核心框架AutoPenTest（GitHub: `autopentest/autopentest-core`，8200星）提供了规划和工具编排层。漏洞链模块基于ChainOfExploit（`chainofexploit/chain`，1500星），该仓库形式化了多步骤漏洞利用规划。代理还使用了Nuclei模板进行初始扫描，但推理层完全自定义。

性能基准测试： 代理在50个故意存在漏洞的应用（“VulnHub 2025”数据集）上进行了测试。结果如下：

| 指标 | 自主AI代理 | 人类专家（平均） | 传统扫描器（Nessus, OpenVAS） |
|---|---|---|---|
| 首次利用时间（分钟） | 12 | 45 | 不适用（无链式利用） |
| 完全入侵时间（分钟） | 47 | 210 | 不适用 |
| 漏洞链完成率 | 68% | 82% | 0%（无链式利用） |
| 每应用误报率 | 1.2 | 0.8 | 14.5 |
| 新颖漏洞发现率 | 22% | 35% | 0%（基于签名） |

数据要点： AI代理在实现完全入侵方面显著快于人类，但在链完成率和新颖发现率上仍落后。然而，其速度优势意味着它能在相同时间内覆盖更多应用，成为红队强大的力量倍增器。

关键参与者与案例研究

多家组织正竞相将自主安全代理商业化。攻破Hoppscotch的代理由Xenith Security开发，这是一家由前DARPA网络研究人员创立的隐形初创公司。Xenith已获得由Sequoia Capital领投的4500万美元A轮融资，目前正与12家企业客户进行私人测试。

竞争解决方案：

| 产品 | 方法 | 自主链式利用？ | 平均入侵时间 | 定价模式 |
|---|---|---|---|---|
| Xenith AutoRed | LLM + 工具编排 | 是 | 47分钟 | 每应用每年15万美元 |
| CrowdStrike Falcon Overwatch | 人类 + AI辅助 | 否（人在回路中） | 4.2小时 | 每年20万美元 |
| Pentera | 自动化验证 | 部分（预定义链） | 2.1小时 | 每年12万美元 |
| Cobalt.io | 人类渗透测试即服务 | 否 | 5-7天 | 每次参与1万美元 |

数据要点： Xenith的自主方法在可比价格点上比人类辅助服务快5倍，但缺乏人类监督引发了关于可靠性和误报的疑问。

案例研究：Hoppscotch的回应

Hoppscotch团队（由Liyas Thomas领导的小型开源社区维护）在披露后12小时内修补了漏洞。修复措施包括对导入URL进行输入验证、移除硬编码凭证以及为文件上传端点实施适当的访问控制。该事件促使Hoppscotch维护者将持续的AI驱动扫描集成到其CI/CD管道中。

时间归档

常见问题

这篇关于“AI Agent Independently Discovers CVSS 10.0 Vulnerability, Breaches Hoppscotch Fully”的文章讲了什么？

In a landmark event for both artificial intelligence and cybersecurity, an autonomous AI agent has successfully discovered and exploited a multi-step vulnerability chain in Hoppsco…

从“How does an autonomous AI agent chain multiple vulnerabilities into a full exploit?”看，这件事为什么值得关注？

The autonomous agent that compromised Hoppscotch is not a simple vulnerability scanner. It is a multi-stage reasoning system built on a large language model (LLM) backbone, augmented with a suite of specialized tools for…

如果想继续追踪“What are the legal implications of AI agents finding zero-day vulnerabilities?”，应该重点看什么？

可以继续查看本文整理的原文链接、相关文章和 AI 分析部分，快速了解事件背景、影响与后续进展。

AI代理自主发现CVSS 10.0漏洞，完全攻破Hoppscotch

技术深度解析

关键参与者与案例研究

更多来自 Hacker News

时间归档

延伸阅读

常见问题