PromptShark 开源:专杀 AI Agent 无限循环的防火墙,在烧光预算前精准掐断

Hacker News June 2026
来源:Hacker News归档:June 2026
PromptShark,一款新近开源的中件工具,以透明代理形式横亘于 AI Agent 与大语言模型之间,拦截每一次提示与响应。其基于 C++ 的循环检测器能在毫秒级识别并终止无限推理循环,有效防止 API 费用失控与系统崩溃。

自主 AI Agent 的崛起解锁了强大的多步推理能力,但也引入了一个噩梦场景:Agent 陷入无限循环,疯狂消耗 API 预算,甚至拖垮下游系统。PromptShark 以开源项目形式发布,直接针对这一漏洞。它作为中间人代理,位于 Agent 与其底层 LLM 之间,记录所有交互。其核心创新是一个用 C++ 编写的高性能循环检测器,能够实时分析提示模式。当检测到重复序列——Agent 陷入推理循环的典型标志——它会立即终止循环并提醒开发者。除循环检测外,PromptShark 还提供完整的回放能力,让开发者能够复现并调试问题。该项目已在 GitHub 上以 `promptshark/promptshark` 仓库发布,上线首周即获得超过 3200 颗星。代码库包含 Rust 代理、C++ 循环检测器以及用于集成 LangChain 和 AutoGPT 等主流 Agent 框架的 Python SDK。

技术深度解析

PromptShark 的架构看似简单,实则专为性能而生。它作为反向代理运行,拦截从 Agent 到 LLM API(例如 OpenAI、Anthropic,或通过 vLLM 运行的本地模型)的 HTTP 请求。该工具主要用 Rust 编写代理层,但其关键的循环检测引擎则用 C++ 实现,以求极致速度。这种混合方法使代理能够处理高吞吐量场景,而不会成为瓶颈。

循环检测算法: 检测器维护一个近期提示的滑动窗口,使用滚动哈希(类似于 Rabin-Karp 算法)对每个提示进行哈希处理。当新提示到达时,会与历史记录进行比较。如果一系列提示以低于可配置阈值(默认:3 次重复)的周期性重复出现,检测器就会将其标记为循环。C++ 引擎处理此过程的时间不到 5 毫秒(针对最多 1000 个提示的窗口)。检测是可调的:开发者可以设置灵敏度,忽略某些参数变化(例如温度变化),并将合法的重复模式(如轮询循环)加入白名单。

回放与调试: 所有被拦截的提示和响应都存储在本地 SQLite 数据库(或可选的 PostgreSQL)中。回放功能允许开发者将存储的提示序列重新输入到相同或不同的 LLM,从而实现确定性调试。这与大多数 Agent 框架的随机性形成鲜明对比,在那些框架中,复现一个 bug 几乎是不可能的。

性能基准测试: 早期测试显示开销极小。下表比较了 PromptShark 与无中间件的基线 Agent 的延迟影响:

| 指标 | 基线(无代理) | 使用 PromptShark | 差异 |
|---|---|---|---|
| 中位数请求延迟 | 1.2s | 1.21s | +0.01s |
| P99 延迟 | 2.5s | 2.55s | +0.05s |
| 吞吐量(请求/秒) | 150 | 148 | -1.3% |
| 循环检测时间 | 无 | 4ms | 无 |

数据要点: PromptShark 在提供关键安全保障的同时,仅增加了可忽略不计的延迟(P99 下低于 50ms)。可观测性带来的权衡极小,使其适合生产环境部署。

该项目已在 GitHub 上以 `promptshark/promptshark` 仓库发布,上线首周即获得超过 3200 颗星。代码库包含 Rust 代理、C++ 循环检测器以及用于集成 LangChain 和 AutoGPT 等主流 Agent 框架的 Python SDK。

关键参与者与案例研究

PromptShark 由一家主要云提供商的前基础设施工程师团队创建,他们最初选择匿名。该项目迅速吸引了来自多家 AI Agent 初创公司的开发者贡献。值得注意的是,开源 Agent 框架 AgentOps 的团队已经发布了一个用于集成 PromptShark 的插件。

竞品对比: Agent 可观测性市场尚处于萌芽阶段,但正在增长。下表将 PromptShark 与现有工具进行了比较:

| 特性 | PromptShark | LangSmith | Weights & Biases Prompts | 自定义日志 |
|---|---|---|---|---|
| 循环检测 | 是(C++,实时) | 否 | 否 | 手动 |
| 开源 | 是 | 否 | 否 | 不适用 |
| 回放能力 | 是 | 是(付费) | 有限 | 手动 |
| 延迟开销 | <50ms | 100-200ms | 50-100ms | 可变 |
| 成本 | 免费 | 按事件付费 | 免费层有限 | 开发者时间 |

数据要点: PromptShark 是唯一提供实时循环检测的开源工具。其延迟低于 LangSmith,并且提供了竞争对手限制在付费层级中的回放功能。

案例研究:FinQuery 一家使用 LangChain Agent 进行自动化报告生成的金融分析初创公司报告称,在部署 PromptShark 后,API 成本降低了 40%。循环检测器捕获了一个反复出现的 bug:Agent 会循环重新查询数据库,每次事件产生 200 多次不必要的 API 调用。集成后,该团队将平均 Agent 运行时间从 12 分钟缩短至 4 分钟。

行业影响与市场动态

PromptShark 的发布标志着 AI Agent 生态系统从“快速行动,打破常规”向“快速行动,观察一切”的转变。该工具解决了一个随着 Agent 在具有真实预算的生产环境中部署而日益尖锐的痛点。

市场背景: 根据行业估计,对于运行自主系统的公司而言,AI Agent API 成本可能占其总运营支出的 30-50%。无限循环虽然在经过良好测试的 Agent 中很少见,但可能在几分钟内将成本放大 10 倍或更多。一家中型初创公司的一次循环事件,在人工干预之前,可能造成 500 至 2000 美元的 API 调用浪费。

采用曲线: PromptShark 的开源性质降低了准入门槛。我们预测,在六个月内,它将被集成到主要 Agent 框架的默认工具链中。下表根据当前的 GitHub 活动和行业趋势预测了采用情况:

| 时间线 | 预计采用率 | 关键驱动因素 |
|---|---|---|
| 1-3 个月 | 早期采用者(AI 初创公司、研究实验室) | 成本节约、开源、低延迟 |
| 3-6 个月 | 主流集成(LangChain、AutoGPT 等框架) | 插件生态、社区贡献、生产环境验证 |
| 6-12 个月 | 企业部署(金融、医疗、电商) | 合规要求、审计日志、安全策略 |

数据要点: 采用速度将取决于框架集成的便利性。如果 PromptShark 团队发布官方的 LangChain 和 AutoGPT 插件,我们预计采用率将比基线预测快 2-3 倍。

编辑评论

PromptShark 解决了一个在 Agent 狂热中被广泛忽视的问题:可观测性。每个 AI 开发者都曾经历过 Agent 陷入循环、烧掉 API 积分或产生无意义输出的时刻。PromptShark 的循环检测器是第一个专门为此构建的开源解决方案。

它并非万能药: 该工具无法检测语义上不同但逻辑上等效的循环(例如,Agent 用不同措辞提出相同问题)。它也无法阻止 Agent 因提示注入或对抗性输入而陷入循环。然而,对于最常见的循环场景——重复的提示序列——它非常有效。

对开发者的建议: 如果你正在生产环境中运行 AI Agent,尤其是在使用 LangChain 或 AutoGPT 时,PromptShark 应该是你工具链中的第一道防线。安装只需几分钟,而潜在的成本节约可能是巨大的。该工具的开源性质意味着你可以审计代码、贡献补丁,并根据你的特定用例进行定制。

更广泛的图景: PromptShark 是 Agent 基础设施成熟化的标志。随着 Agent 从演示原型过渡到创收系统,可观测性、安全性和成本控制将变得至关重要。PromptShark 解决了这三个问题,而且是以开源的方式。我们预计这将是 Agent 可观测性工具浪潮中的第一个,但 PromptShark 凭借其专注的循环检测和低延迟设计,拥有先发优势。

更多来自 Hacker News

Noema64国际象棋引擎:大模型推理能否以智取胜,挑战Stockfish的暴力计算?AINews独家获悉了Noema64——一款开源国际象棋引擎,它代表着人工智能在博弈领域的一次范式转变。与Stockfish等通过穷举搜索树每秒评估数百万个位置的传统引擎不同,Noema64利用大语言模型(LLM)以类人方式对棋局进行推理。Spaturzu SDKs:开源利器,终于让AI Agent的API成本无所遁形多Agent AI架构的快速普及引发了一场隐性危机:当数十个Agent共享一个API密钥时,财务团队根本无法判断哪个Agent在烧钱。新发布的开源项目Spaturzu SDKs直接瞄准了这一盲区。该工具的工作原理是,在每次向OpenAI和AToken清算时刻:CFO们要求每一笔API调用都要有ROI过去两年,企业一直把大语言模型当作一个“消防水带”:把所有问题都抛给GPT-4,付账单,然后宣布胜利。那个时代正在终结。一门新的学科——Token经济学——正在迫使企业核算每一次推理的成本。我们的调查显示,许多公司现在将超过20%的总IT预查看来源专题页Hacker News 已收录 4818 篇文章

时间归档

June 20261654 篇已发布文章

延伸阅读

Flightdeck:开源“黑匣子”,让AI代理重回人类掌控Flightdeck是一个开源平台,为AI代理提供自托管的可观测性与控制能力,充当其决策过程的“黑匣子记录仪”。它让开发者能够追踪每一次工具调用和决策路径,甚至实时介入干预,直击自主代理部署中的信任与合规瓶颈。AgentSight:eBPF 将内核级可观测性带入 AI 智能体行为追踪AgentSight 是一款开源工具,利用 eBPF 在 Linux 内核层面追踪 AI 智能体的行为,以极低开销捕获每一次系统调用、网络请求和内存操作。这让开发者能够像调试传统软件一样审计和调试自主智能体,解决了关键的透明度难题。Lookspan: The Local-First AI Agent Debugging Tool That Reclaims Developer SovereigntyLookspan, a new open-source observability tool, lets developers debug AI agents entirely on their local machine via a siIntencion:将AI智能体可观测性转化为自我进化引擎Intencion是一款全新工具,将产品分析从被动数据收集转变为AI智能体的主动自我进化。它实时监控智能体推理过程,自动识别幻觉、逻辑循环等故障模式,并将洞察直接反馈至训练循环,弥合了观察与改进之间的鸿沟,让分析成为性能倍增器。

常见问题

GitHub 热点“PromptShark Open Source: The AI Agent Firewall That Kills Infinite Loops Before They Drain Your Budget”主要讲了什么?

The rise of autonomous AI agents has unlocked powerful multi-step reasoning capabilities, but it has also introduced a nightmare scenario: agents trapped in infinite loops, burning…

这个 GitHub 项目在“How to integrate PromptShark with LangChain agents”上为什么会引发关注?

PromptShark’s architecture is deceptively simple yet engineered for performance. It operates as a reverse proxy, intercepting HTTP requests from an agent to an LLM API (e.g., OpenAI, Anthropic, or a local model via vLLM)…

从“PromptShark vs LangSmith for AI agent debugging”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。