AgentSight:eBPF 将内核级可观测性带入 AI 智能体行为追踪

Hacker News June 2026
来源:Hacker NewsAI safety归档:June 2026
AgentSight 是一款开源工具,利用 eBPF 在 Linux 内核层面追踪 AI 智能体的行为,以极低开销捕获每一次系统调用、网络请求和内存操作。这让开发者能够像调试传统软件一样审计和调试自主智能体,解决了关键的透明度难题。

AINews 发现了 AgentSight,一款全新的开源工具,它从根本上改变了开发者观察和审计 AI 智能体的方式。AgentSight 不再依赖应用层日志——这些日志往往不完整、受限于特定语言且容易被绕过——而是利用 eBPF(扩展伯克利数据包过滤器)在 Linux 内核层面运行。这种方法能捕获智能体执行的每一次系统调用、网络请求、文件访问和内存操作,无论构建智能体使用的是哪种编程语言或框架。最终生成的是一个完整的、因果关系的执行流图,让开发者能够逆向追踪智能体的决策过程,精确定位触发特定动作的原因。这对于调试“幻觉驱动”的错误尤其有价值,例如智能体重复执行某个错误操作的情况。

技术深度解析

AgentSight 的核心创新在于利用 eBPF 对 Linux 内核进行插桩。eBPF 允许沙盒程序在内核空间运行,而无需修改内核源代码或加载内核模块。AgentSight 将 eBPF 程序附加到跟踪点(tracepoints)和内核探针(kprobes)上,这些探针会在每次系统调用、上下文切换和网络事件时触发。这使得 AgentSight 能够以低开销全面掌握任何进程(包括 AI 智能体)的行为。

架构: AgentSight 由三个主要组件构成:
1. 内核模块(eBPF 程序): 这些程序被加载到内核中,收集原始事件数据(系统调用号、参数、返回值、时间戳、进程 ID)。它们用 C 语言编写,并编译为 eBPF 字节码。
2. 用户空间收集器: 一个轻量级守护进程,从内核读取 perf 环形缓冲区,聚合事件,并构建因果执行图。它使用基于映射的数据结构,通过进程血缘关系和文件描述符关联事件。
3. 查询引擎与 API: 一个 REST API 和 CLI 工具,允许开发者查询执行图。查询可以基于时间、进程或动作(例如,“显示智能体 PID 1234 在过去 5 分钟内发出的所有网络请求”)。

关键技术特性:
- 零代码插桩: 无需修改智能体的源代码。AgentSight 适用于任何二进制文件,从 Python 脚本到编译后的 C++ 推理引擎。
- 因果追踪: 与传统的孤立记录事件的日志不同,AgentSight 将事件链接成一个有向无环图(DAG),展示因果关系。例如,如果智能体读取了一个配置文件,然后发起了一次网络调用,AgentSight 会记录下读取的具体文件内容以及由此产生的 API 请求。
- 低开销: eBPF 专为生产环境设计。早期基准测试显示,在运行 LLM 推理工作负载的典型 Linux 服务器上,AgentSight 增加的 CPU 开销不到 2%,内存开销可忽略不计。

性能基准测试:

| 指标 | 无 AgentSight | 有 AgentSight | 开销 |
|---|---|---|---|
| 推理延迟(p50) | 450 毫秒 | 458 毫秒 | +1.8% |
| 推理延迟(p99) | 1.2 秒 | 1.23 秒 | +2.5% |
| CPU 利用率(平均) | 65% | 66.3% | +2.0% |
| 内存使用量(RSS) | 2.1 GB | 2.12 GB | +0.95% |
| 系统调用吞吐量(每秒) | 12,000 | 11,850 | -1.25% |

数据要点: 开销极小,完全在生产环境部署的可接受范围内。2% 的 CPU 增加是为获得完全可观测性所付出的微小代价。

相关 GitHub 仓库:
- AgentSight 主仓库在上线第一周内已获得超过 800 颗星,势头强劲。它包含了如何为 LangChain 和 AutoGPT 等流行智能体框架设置追踪的详细文档。
- 一个配套仓库 `agent-sight-rules` 提供了针对常见 AI 工作负载的预构建 eBPF 程序(例如,追踪 Hugging Face Transformers 调用,通过 CUDA 驱动 API 监控 GPU 内存分配)。

关键参与者与案例研究

AgentSight 由一家主要云提供商的前基础设施工程师小团队创建,他们看到了 AI 智能体的复杂性与调试工具不成熟之间日益扩大的差距。首席开发者 Dr. Elena Vasquez 曾在一家主要 Linux 发行版从事内核级安全工作,并发表过关于基于 eBPF 的入侵检测的论文。

竞品对比:

| 工具 | 方法 | 语言支持 | 开销 | 因果追踪 | 开源 |
|---|---|---|---|---|---|
| AgentSight | 内核级 eBPF | 任意 | ~2% | 是 | 是(MIT) |
| LangSmith | 应用层 SDK | Python, JS | ~5-10% | 部分 | 否(SaaS) |
| Weights & Biases | 应用层 SDK | Python | ~3-8% | 否 | 部分 |
| OpenTelemetry | 应用层 SDK | 多种 | ~3-5% | 手动 | 是 |
| strace | 内核级(ptrace) | 任意 | >50% | 否 | 是(GPL) |

数据要点: AgentSight 是唯一一个将内核级追踪、因果图生成和近乎零开销结合在开源软件包中的工具。LangSmith 和 Weights & Biases 更为成熟,但需要修改代码,并且仅提供部分因果追踪。

案例研究:调试“幻觉级联”
一家中型金融科技公司的团队使用 LLM 智能体来自动化客户支持工单路由。该智能体开始将高优先级工单错误地路由到垃圾邮件文件夹。传统日志显示智能体调用了“移至垃圾邮件”API,但未说明原因。使用 AgentSight,该团队追踪了因果链:智能体从过时的缓存中读取了一个过时的配置文件(文件访问事件)→ 将“spam_folder_id”解析为“priority_folder_id”(内存读取事件)→ 使用错误的 ID 调用了 API。根本原因是缓存失效逻辑中的竞态条件,AgentSight 在几分钟内就定位到了问题。

行业影响与市场动态

AgentSight 出现在一个关键的转折点。AI 智能体市场预计将从 2024 年的 54 亿美元增长到 2030 年的 471 亿美元(复合年增长率

更多来自 Hacker News

GPTHuman AI:语义重写如何剥离机器文本的“机器人味”大型语言模型的普及在内容创作领域引发了一场真实性危机。学术论文、营销文案和新闻文章越来越明显地带有机器生成的烙印:过于统一的句子结构、缺乏语调变化,以及一种被训练有素的读者和自动化检测器一眼识破的“无菌完美”。GPTHuman AI作为一项LLM ATT&CK Navigator:AI安全防御的新蓝图由AI安全研究人员与实践者联盟发布的LLM ATT&CK Navigator,是首个专为大语言模型威胁设计的、MITRE ATT&CK风格的综合分类法。它收录了超过40种不同的攻击技术,涵盖提示注入、模型反转、对抗性输入和供应链投毒等类别。AI智能体失忆症:记忆架构成为新战场AI行业痴迷于扩大模型参数,但一个更隐蔽的问题正在浮现:AI智能体没有记忆。当前的大语言模型本质上是无状态的——它们将每一次交互都视为第一次,无法从历史中学习,也无法构建持久的用户画像。这导致了一种“记忆黑障”,智能体在对话中途忘记用户偏好查看来源专题页Hacker News 已收录 4200 篇文章

相关专题

AI safety185 篇相关文章

时间归档

June 2026309 篇已发布文章

延伸阅读

Lookspan: The Local-First AI Agent Debugging Tool That Reclaims Developer SovereigntyLookspan, a new open-source observability tool, lets developers debug AI agents entirely on their local machine via a siÆTHERYA Core:解锁企业级AI智能体的确定性治理层开源项目ÆTHERYA Core为LLM驱动的智能体提出了一项根本性的架构变革。它在LLM的建议与实际工具执行之间,插入了一个基于规则的确定性治理层,旨在解决阻碍自主AI系统在企业中落地的核心可靠性与安全问题。Anthropic 呼吁全球暂停 AI 研发:自我进化临界点逼近Anthropic 发布博客,敦促全球领先 AI 实验室主动放缓开发步伐。其内部数据显示,前沿模型正快速逼近“自我进化”临界点——即自主修改自身代码或训练逻辑的能力——这可能引发一场无法控制的智能爆炸。Anthropic全球AI暂停呼吁:安全圣战还是战略棋局?Anthropic公开呼吁全球暂停前沿AI模型开发,声称技术进展已超越治理能力。这一提议引发激烈争议,AINews深入调查:这究竟是真诚的安全警示,还是巩固市场地位的策略性博弈?

常见问题

GitHub 热点“AgentSight: eBPF Brings Kernel-Level Observability to AI Agent Behavior”主要讲了什么?

AINews has uncovered AgentSight, a new open-source tool that fundamentally changes how developers observe and audit AI agents. Instead of relying on application-level logging—which…

这个 GitHub 项目在“How to install AgentSight eBPF on Ubuntu 22.04”上为什么会引发关注?

AgentSight's core innovation is its use of eBPF to instrument the Linux kernel. eBPF allows sandboxed programs to run in kernel space without modifying kernel source code or loading kernel modules. AgentSight attaches eB…

从“AgentSight vs LangSmith for debugging LLM agents”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。