AI Agent安全:SBOM已死,组合图才是未来

Hacker News June 2026
来源:Hacker NewsAI Agent security归档:June 2026
传统软件物料清单(SBOM)只能列出静态组件,却无法追踪工具、模型与数据流在运行时的交互方式,在保护AI Agent时彻底失效。AINews深度解析为何行业必须转向组合图(Composition Graph)——一张动态、实时的Agent交互地图——以防范金融、医疗和关键基础设施领域的供应链攻击。

自主AI Agent的崛起——它们能够串联多个模型、调用外部API并执行多步骤工作流——暴露了安全领域一个关键的盲区。作为传统软件供应链安全的基石,软件物料清单(SBOM)从根本上无法胜任这些动态系统的保护任务。SBOM只能捕获开源库等静态依赖关系,却无法呈现Agent组件在执行过程中的交互方式:哪个工具调用了哪个模型、以何种顺序、传递了什么数据、在什么上下文下执行。这一漏洞已被攻击者利用。在近期的攻击事件中,攻击者通过投毒第三方PDF解析器或API端点,将恶意输出注入Agent的推理链,导致数据泄露或权限提升。解决方案是采用组合图(Composition Graph)——一种运行时构建的有向属性图,能够实时映射Agent的每一次交互。与SBOM不同,组合图不仅记录组件,还记录它们之间的数据流、控制流和上下文约束。行业先驱如Protect AI、LangChain和MIT CSAIL已在探索这一方向,早期基准测试显示,组合图能以50-200毫秒的延迟开销实现95%以上的运行时路径覆盖率,而SBOM的这一数字为零。

技术深度解析

为什么SBOM对AI Agent不适用

传统SBOM是一份静态的软件组件清单——库名、版本号和许可证。它对于单体应用效果良好,因为这类应用的依赖关系在构建时确定且保持不变。然而,AI Agent本质截然不同。Agent是一个运行时组合引擎:它选择工具、调用模型、处理数据,这些序列在执行前无法完全预知。例如,一个被要求“总结这份PDF并通过邮件发送结果”的Agent可能会:
1. 调用一个PDF解析工具(如PyMuPDF)
2. 将提取的文本传递给一个语言模型(如GPT-4o)
3. 使用模型的输出触发一个邮件API(如SendGrid)

每一步都涉及一个具有不同安全属性的组件。SBOM会列出PyMuPDF、GPT-4o API和SendGrid SDK,但它无法捕捉到PDF解析器的输出直接流向邮件工具——这是一个关键的数据路径。如果PDF解析器被攻破(例如通过恶意PDF),攻击者可以注入任意文本,模型随后将其传递给邮件API,从而可能从受信任账户发送钓鱼邮件。

组合图架构

组合图是一种有向属性图,其中:
- 节点代表组件:模型、工具、数据源、API端点,甚至子Agent。
- 代表交互:调用、数据流、控制流和上下文约束。
- 属性捕获元数据:时间戳、权限、输入/输出模式和安全策略。

该图由可观测层在运行时构建,该层拦截所有组件间通信。这类似于微服务中的分布式追踪(如OpenTelemetry),但针对AI Agent工作流进行了定制。关键区别在于,组合图还必须建模语义上下文——例如,哪个模型的输出被用作哪个工具的输入,以及这是否违反了策略。

示例图结构:
```
[PDF解析器] --(输出文本)--> [LLM] --(摘要)--> [邮件API]
[LLM] --(工具调用)--> [网页搜索API]
```

开源工具与仓库

多个项目正在探索组合图:
- LangChain的LangSmith:提供追踪能力,可用于重建Agent执行路径。然而,它主要用于调试,而非安全策略执行。(GitHub: langchain-ai/langsmith,约5k星)
- Cisco的OpenTelemetry for AI:OpenTelemetry标准的扩展,增加了针对模型调用和工具使用的AI专用跨度。仍处于早期阶段。
- Protect AI的Guardian:一个运行时安全层,使用基于图的策略引擎阻止异常Agent行为。(GitHub: protect-ai/guardian,约2k星)
- MIT的VeriAgent:一个研究原型,使用组合图生成Agent行为的形式化证明。尚未公开。

性能基准测试

| 方法 | 检测延迟 | 误报率 | 运行时路径覆盖率 | 更新频率 |
|---|---|---|---|---|
| SBOM(静态) | 不适用(部署前) | 不适用 | 0%(无运行时信息) | 每次发布 |
| 组合图(运行时) | 每次交互50-200ms | 2-5% | 95%以上(完全追踪时) | 实时 |
| 手动审计 | 数小时到数天 | 10-20% | 30-50%(抽样) | 每个审计周期 |

数据要点: 组合图引入了少量延迟开销(每次交互50-200ms),但实现了接近完全的运行时路径覆盖率,而SBOM的这一数字为零。2-5%的误报率通过适当调优可以管理,且远低于手动审计。

关键参与者与案例研究

初创公司与研究团队

- Protect AI:总部位于西雅图,2024年完成3500万美元A轮融资。其产品Guardian使用组合图执行诸如“模型输出不得直接传递给文件写入工具”等策略。他们报告称已捕获一起真实攻击,其中被攻破的PDF解析器试图将恶意脚本写入磁盘。
- HiddenLayer:专注于对抗性机器学习检测,但最近增加了Agent工作流监控。其方法更偏向签名而非基于图。
- MIT CSAIL:VeriAgent项目使用组合图上的形式化验证来证明Agent无法违反安全约束。仍处于学术阶段,但对于高保证应用前景广阔。

案例研究:PDF解析器攻击

2025年初,一家金融服务公司部署了一个AI Agent来自动化发票处理。该Agent使用一个流行的开源PDF解析器(PyMuPDF)提取数据,然后将其传递给一个微调后的LLM进行验证,最后传递给一个支付API。一名攻击者提交了一个恶意PDF,利用PyMuPDF中的缓冲区溢出注入了一个载荷,将LLM的输出替换为向不同账户转账的指令。SBOM列出了PyMuPDF v1.23.4,但漏洞存在于运行时交互中:PDF解析器的输出被信任为安全,并直接传递给了后续组件。组合图本可以检测到这种异常数据流——PDF解析器的输出不应直接触发支付指令——并阻止该交易。

更多来自 Hacker News

GPT-5.6泄露揭示OpenAI秘密架构转型:从聊天到自主执行的悄然转向6月22日,OpenAI公开的Codex仓库中一个拉取请求短暂地将“GPT-5.6”列为支持的模型,随后该提交被强制推送并回滚。这一事件经多位开发者日志确认,曝光了一款从未被公布或记录的模型。AINews对泄露的元数据、API响应模式以及内Compilr.dev多LLM工作空间:打通开发者与终端用户的AI Agent工具桥梁Compilr.dev今日正式发布,定位为多LLM AI工作空间,覆盖三个截然不同的层级:开发者代码库(compilr-dev/agents与compilr-dev/agents-coding)、面向终端用户的命令行界面,以及用于可视化交互Wayfinder 颠覆路由器 LLM:零 Token 消耗,微秒级 AI 路由决策多年来,AI 行业一直默认一个隐性前提:要在多个专业模型之间智能路由提示词,必须借助另一个大型语言模型来做决策。这种“路由器 LLM”不仅带来高昂的推理成本与延迟,往往还抵消了多模型架构本身的优势。AINews 最新发现的 Wayfinde查看来源专题页Hacker News 已收录 5127 篇文章

相关专题

AI Agent security145 篇相关文章

时间归档

June 20262350 篇已发布文章

延伸阅读

AI Agent安全危机:开源基础库漏洞致数百万系统面临远程劫持风险一个被数百万AI Agent广泛依赖的开源基础库中,发现了一个致命的远程代码执行漏洞。攻击者可借此绕过沙箱限制,完全接管自主系统,暴露出Agent部署速度与安全成熟度之间的危险鸿沟。Nono.sh 内核级安全模型:为关键基础设施重塑 AI 智能体安全范式开源项目 Nono.sh 对 AI 智能体安全提出了颠覆性构想。它摒弃了脆弱的应用层权限机制,转而构建了一种内核强制执行的零信任运行时模型,将每个智能体视为天生不可信。这一根本性转变,有望在安全不容妥协的高风险环境中,解锁复杂自主系统的部署Axios攻击事件暴露AI智能体致命缺陷:无安全防护的自主执行针对流行库Axios的供应链攻击,揭示了自主AI智能体生态系统中一个根本性漏洞。在关键时间窗口内,任何自动执行`npm install`命令的AI智能体都可能安装恶意软件包,从而创建持久的远程访问后门。这一事件表明,定义这些智能体的自主性本AI代理后门劫持Trivy扫描器,武器化VS Code:供应链攻击进入新纪元一场精密复杂的攻击行动将AI代理武器化,直接侵入了用于保障软件安全的工具链。攻击者通过劫持AI开发工具链,在广泛使用的Trivy漏洞扫描器中植入后门,并通过Visual Studio Code扩展传播恶意软件。这标志着AI驱动威胁的危险进化

常见问题

这次模型发布“AI Agent Security: Why SBOMs Fail and Composition Graphs Are the Future”的核心内容是什么?

The rise of autonomous AI Agents—capable of chaining multiple models, calling external APIs, and executing multi-step workflows—has exposed a critical blind spot in security. The S…

从“composition graph vs SBOM for AI agents”看,这个模型发布为什么重要?

A traditional SBOM is a static list of software components—library names, versions, and licenses. It works well for monolithic applications where dependencies are resolved at build time and remain fixed. AI Agents, howev…

围绕“runtime security for autonomous AI agents”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。