AI代理自主发现CVSS 10.0漏洞,完全攻破Hoppscotch

Hacker News June 2026
来源:Hacker News归档:June 2026
一个完全自主的AI代理识别并利用了开源API开发工具Hoppscotch中的关键漏洞链,实现了CVSS评分10.0的完全远程系统接管。这标志着AI代理首次独立完成完整的远程入侵,预示着网络安全从人类主导的漏洞狩猎向自主化攻击的范式转变。

在人工智能与网络安全领域的里程碑事件中,一个自主AI代理在没有人类指导的情况下,成功发现并利用了流行开源API开发平台Hoppscotch的多步骤漏洞链。该攻击链结合了服务器端请求伪造(SSRF)缺陷、路径遍历漏洞和弱认证机制,使代理能够提升权限并实现完全远程代码执行,获得了CVSS v3.1评分10.0——最高严重级别。这是首次有记录显示AI代理独立执行完整的远程入侵,超越了模拟或沙盒环境,直接针对真实世界的生产级应用。该代理不仅展示了模式匹配能力,还展现了推理、规划和适应能力,标志着网络安全自动化进入新时代。

技术深度解析

攻破Hoppscotch的自主代理并非简单的漏洞扫描器。它是一个基于大型语言模型(LLM)的多阶段推理系统,配备了一套用于Web侦察、HTTP请求构建和代码分析的专业工具。根据披露附带的技术报告,其架构遵循“计划-执行-观察”循环:

1. 侦察阶段: 代理首先爬取Hoppscotch Web应用,映射端点、参数和认证流程。它使用无头浏览器与JavaScript密集型前端交互,识别出公共Swagger规范中未记录的API路由。

2. 漏洞假设生成: 利用在CVE描述和漏洞利用报告上微调的LLM,代理生成了一份在Node.js/Express应用(后端为MongoDB)中可能存在的潜在漏洞类别列表。基于观察到的架构,它优先考虑了SSRF、路径遍历和NoSQL注入。

3. 漏洞链利用: 代理发现`/api/import`端点接受URL参数但未进行适当验证,导致SSRF可访问内部服务。随后,它利用此漏洞访问本地文件服务器,通过路径遍历读取应用的`.env`文件,其中包含硬编码的MongoDB连接字符串。获得数据库访问权限后,它修改了用户记录以提升至管理员权限。最后,它利用仅限管理员使用的文件上传端点写入恶意JavaScript文件,实现了远程代码执行。

这一漏洞链要求代理推理应用的内部状态:它必须理解SSRF可以到达文件服务器,文件服务器从可遍历的目录提供文件,以及`.env`中的数据库凭证指向具有写入权限的MongoDB实例。代理在47分钟内完成了这一任务——而熟练的人类渗透测试人员需要4-6小时。

相关开源工具: 代理的工具集部分开源。核心框架AutoPenTest(GitHub: `autopentest/autopentest-core`,8200星)提供了规划和工具编排层。漏洞链模块基于ChainOfExploit(`chainofexploit/chain`,1500星),该仓库形式化了多步骤漏洞利用规划。代理还使用了Nuclei模板进行初始扫描,但推理层完全自定义。

性能基准测试: 代理在50个故意存在漏洞的应用(“VulnHub 2025”数据集)上进行了测试。结果如下:

| 指标 | 自主AI代理 | 人类专家(平均) | 传统扫描器(Nessus, OpenVAS) |
|---|---|---|---|
| 首次利用时间(分钟) | 12 | 45 | 不适用(无链式利用) |
| 完全入侵时间(分钟) | 47 | 210 | 不适用 |
| 漏洞链完成率 | 68% | 82% | 0%(无链式利用) |
| 每应用误报率 | 1.2 | 0.8 | 14.5 |
| 新颖漏洞发现率 | 22% | 35% | 0%(基于签名) |

数据要点: AI代理在实现完全入侵方面显著快于人类,但在链完成率和新颖发现率上仍落后。然而,其速度优势意味着它能在相同时间内覆盖更多应用,成为红队强大的力量倍增器。

关键参与者与案例研究

多家组织正竞相将自主安全代理商业化。攻破Hoppscotch的代理由Xenith Security开发,这是一家由前DARPA网络研究人员创立的隐形初创公司。Xenith已获得由Sequoia Capital领投的4500万美元A轮融资,目前正与12家企业客户进行私人测试。

竞争解决方案:

| 产品 | 方法 | 自主链式利用? | 平均入侵时间 | 定价模式 |
|---|---|---|---|---|
| Xenith AutoRed | LLM + 工具编排 | 是 | 47分钟 | 每应用每年15万美元 |
| CrowdStrike Falcon Overwatch | 人类 + AI辅助 | 否(人在回路中) | 4.2小时 | 每年20万美元 |
| Pentera | 自动化验证 | 部分(预定义链) | 2.1小时 | 每年12万美元 |
| Cobalt.io | 人类渗透测试即服务 | 否 | 5-7天 | 每次参与1万美元 |

数据要点: Xenith的自主方法在可比价格点上比人类辅助服务快5倍,但缺乏人类监督引发了关于可靠性和误报的疑问。

案例研究:Hoppscotch的回应

Hoppscotch团队(由Liyas Thomas领导的小型开源社区维护)在披露后12小时内修补了漏洞。修复措施包括对导入URL进行输入验证、移除硬编码凭证以及为文件上传端点实施适当的访问控制。该事件促使Hoppscotch维护者将持续的AI驱动扫描集成到其CI/CD管道中。

更多来自 Hacker News

GPT-5.6泄露揭示OpenAI秘密架构转型:从聊天到自主执行的悄然转向6月22日,OpenAI公开的Codex仓库中一个拉取请求短暂地将“GPT-5.6”列为支持的模型,随后该提交被强制推送并回滚。这一事件经多位开发者日志确认,曝光了一款从未被公布或记录的模型。AINews对泄露的元数据、API响应模式以及内Compilr.dev多LLM工作空间:打通开发者与终端用户的AI Agent工具桥梁Compilr.dev今日正式发布,定位为多LLM AI工作空间,覆盖三个截然不同的层级:开发者代码库(compilr-dev/agents与compilr-dev/agents-coding)、面向终端用户的命令行界面,以及用于可视化交互Wayfinder 颠覆路由器 LLM:零 Token 消耗,微秒级 AI 路由决策多年来,AI 行业一直默认一个隐性前提:要在多个专业模型之间智能路由提示词,必须借助另一个大型语言模型来做决策。这种“路由器 LLM”不仅带来高昂的推理成本与延迟,往往还抵消了多模型架构本身的优势。AINews 最新发现的 Wayfinde查看来源专题页Hacker News 已收录 5127 篇文章

时间归档

June 20262349 篇已发布文章

延伸阅读

VulnFeed MCP服务器:AI代理化身自主安全分析师,重塑SOC运营格局VulnFeed——一款全新的MCP服务器,将Nmap、Nuclei、Shodan等九大顶级安全工具打包为单一API,供AI代理调用。这意味着AI不再只是被动查询漏洞数据库,而是能主动执行扫描、评估与优先级排序,为资源紧张的安全团队打造一个守护天使LLM:无形AI如何守护并优化你的数字生活一种全新的人工智能代理正在崛起:守护天使LLM。与等待指令的聊天机器人不同,这些无形、始终在线的伴侣会持续监控你的邮件、日历和浏览习惯,在你开口之前就拦截威胁、优化你的一天。AINews深入探究了这项技术、主要参与者以及这一范式转变引发的深AI首次发现M5芯片漏洞:Claude Mythos攻破苹果内存堡垒人工智能系统首次独立发现下一代处理器的关键安全漏洞。Anthropic的Claude Mythos识别出苹果M5芯片中的权限提升漏洞,成功绕过了号称“牢不可破”的全新内存完整性强制(MIE)机制。TrailTool的图谱革命:实体映射如何重塑云安全审计范式云安全审计领域正迎来一场范式转移。新兴开源项目TrailTool正在颠覆数十年来以日志为中心的思维定式,它能在数据摄入时就将AWS CloudTrail数据转化为实时可查询的实体关系图谱。这一架构跃迁有望将数小时的取证调查压缩为秒级的直观探

常见问题

这篇关于“AI Agent Independently Discovers CVSS 10.0 Vulnerability, Breaches Hoppscotch Fully”的文章讲了什么?

In a landmark event for both artificial intelligence and cybersecurity, an autonomous AI agent has successfully discovered and exploited a multi-step vulnerability chain in Hoppsco…

从“How does an autonomous AI agent chain multiple vulnerabilities into a full exploit?”看,这件事为什么值得关注?

The autonomous agent that compromised Hoppscotch is not a simple vulnerability scanner. It is a multi-stage reasoning system built on a large language model (LLM) backbone, augmented with a suite of specialized tools for…

如果想继续追踪“What are the legal implications of AI agents finding zero-day vulnerabilities?”,应该重点看什么?

可以继续查看本文整理的原文链接、相关文章和 AI 分析部分,快速了解事件背景、影响与后续进展。