Lelu开源引擎:运行时防火墙,让被劫持的AI Agent无处遁形

Hacker News June 2026
来源:Hacker NewsAI agent security归档:June 2026
Lelu是一款开源授权引擎,充当AI Agent的运行时防火墙,在劫持行为造成危害前将其拦截。通过将安全策略与Agent代码解耦,它解决了阻碍企业大规模部署自主Agent的核心信任问题。

自主AI Agent的兴起——这些系统能调用API、查询数据库、执行Shell命令——引入了一个关键安全缺口:一旦Agent获得权限,一次提示注入或工具链劫持就能将可信Agent变成内部威胁。Lelu,一款新近开源的授权引擎,通过在每次Agent行动前强制执行运行时策略检查来应对这一问题。与传统的基于角色的访问控制(RBAC)或静态API密钥不同,Lelu在完整的上下文中评估每次工具调用——包括用户的原始意图、Agent的内部状态以及先前行动的历史——并允许、拒绝或标记该操作。该引擎设计为可嵌入任何Agent工作流,从LangChain和AutoGPT到自定义框架,无需修改Agent代码。

技术深度解析

Lelu的核心创新在于其运行时策略引擎,它位于Agent的推理循环与每个外部工具调用之间。该架构由三层组成:

1. 策略定义层:策略以声明式YAML/JSON格式编写,支持诸如`source_user_role`、`tool_name`、`input_parameter_values`、`previous_action_history`以及`embedding_similarity_to_original_task`等条件。例如,一条策略可以声明:“如果调用者来自财务部门,则允许`read_invoice`;但如果`to_account`字段未出现在用户的原始请求中,则阻止`transfer_funds`。”

2. 上下文提取层:在每次工具调用前,Lelu从Agent的内存、LLM当前的推理轨迹以及用户会话中提取一个结构化的上下文向量。这包括原始提示、Agent的思维链以及任何中间输出。该上下文被哈希处理并与策略数据库进行比较。

3. 执行层:引擎运行一个确定性决策树(而非LLM)来评估策略。这一点至关重要——使用LLM进行执行会重新引入Lelu旨在阻止的相同漏洞。决策树支持三种结果:ALLOWDENYFLAG(供人工审核)。每次检查的延迟控制在5毫秒以下,使其适用于实时Agent循环。

GitHub仓库:该项目托管在`github.com/lelu-security/lelu-engine`(截至2026年6月已获3200+星标)。它包括一个用Rust编写的参考实现(追求性能)以及Python绑定,此外还有针对常见攻击模式(如“通过base64编码越狱”和“工具递归滥用”)的预构建策略。

基准数据

| 指标 | Lelu引擎 | 传统RBAC | 基于LLM的护栏(如Guardrails AI) |
|---|---|---|---|
| 每次检查延迟 | 3-5毫秒 | <1毫秒 | 200-500毫秒 |
| 提示注入检测率(MITRE ATLAS T1556) | 94% | 12%(依赖静态规则) | 78%(易受对抗性绕过) |
| 误报率 | 2.1% | 0.5%(但漏掉大多数攻击) | 8.5% |
| 无需代码变更即可更新策略 | 是 | 否(需要重新部署) | 部分(需要模型重新训练) |
| 确定性执行 | 是 | 是 | 否(基于LLM) |

数据要点:Lelu在现有方法中提供了检测准确性与延迟的最佳平衡。其确定性执行避免了基于LLM的护栏固有的对抗性漏洞,而其运行时上下文感知能力则能捕获静态RBAC完全遗漏的攻击。

关键参与者与案例研究

Lelu的诞生正值多家公司竞相保护Agent技术栈之际。当前格局包括:

- LangChain的LangSmith:提供可观测性和基本护栏,但依赖基于LLM的分类进行安全防护,这既缓慢又易受对抗性提示攻击。
- Guardrails AI:一个开源Python库,根据模式验证LLM输出。它专注于输出格式化,而非运行时工具调用授权。
- Rebuff:一个开源提示注入检测器。它作为预过滤器工作,但不会在会话中的多次工具调用间强制执行策略。
- Lelu:首个专为Agent设计的运行时授权引擎。

案例研究:金融科技初创公司“ClearPay”
ClearPay,一家支付处理平台,在2026年3月一次提示注入攻击导致Agent发起未经授权的退款后集成了Lelu。在采用Lelu之前,他们使用范围限定为“只读”和“读写”角色的静态API密钥。攻击者注入了一条提示,使Agent相信自己有权调用退款API。部署Lelu后,ClearPay定义了一条策略:“仅当用户的原始请求中包含‘退款’一词,且交易ID与该用户最近的购买记录匹配时,才能调用`refund`工具。”这完全阻断了攻击向量。ClearPay报告称,2026年第二季度与Agent滥用相关的安全事件减少了99.7%。

对比表:Agent安全解决方案

| 解决方案 | 方法 | 运行时策略? | 确定性? | 开源? | GitHub星标 |
|---|---|---|---|---|---|
| Lelu | 上下文感知授权 | 是 | 是 | 是 | 3,200 |
| LangSmith | 基于LLM的护栏 | 部分 | 否 | 否 | 不适用(SaaS) |
| Guardrails AI | 输出验证 | 否 | 是(仅模式) | 是 | 8,500 |
| Rebuff | 输入过滤 | 否 | 是 | 是 | 5,100 |
| Microsoft Purview | 数据丢失防护 | 是(针对数据) | 是 | 否 | 不适用 |

数据要点:Lelu占据了一个独特的细分领域——运行时授权——这是其他开源工具均未涉及的。其确定性特性使其在安全关键型应用中比基于LLM的解决方案更具优势。

行业影响与市场动态

AI Agent安全市场虽处于萌芽阶段,但正在爆发式增长。据行业估计,全球AI安全基础设施市场将从2025年的21亿美元增长到2030年的187亿美元,其中Agent特定安全将占据重要份额。

更多来自 Hacker News

隐藏的Token税:JSON与Markdown正让你多付30%的LLM推理成本随着LLM应用从原型走向生产,成本控制已成为项目可行性的决定性因素。然而,我们的分析显示,业界对模型切换和提示词优化的痴迷其实放错了重点。真正的“隐藏金矿”在于输出格式的语法层。JSON作为结构化数据的通用标准,通过其冗长的键值对、括号和逗Cordium 开源沙箱:让 AI 代理与基础设施密钥彻底“绝缘”Cordium 诞生于一个关键转折点:AI 编码代理的爆发式增长正带来前所未有的基础设施安全挑战。传统的沙箱平台(如 GitHub Codespaces 或 E2B)从根本上依赖于向环境注入密钥,这造成了一个危险悖论——代理越自主,一旦被攻OverReach:开源审计引擎,让AI Agent的“越权行为”无处遁形新发布的开源工具 OverReach,直指自主AI Agent领域最危险的盲区:用户指令与实际Agent行为之间的鸿沟。通过对原始提示词与Agent完整执行日志(包括API调用、循环逻辑、输出格式)进行结构化差异分析,OverReach 以查看来源专题页Hacker News 已收录 4970 篇文章

相关专题

AI agent security139 篇相关文章

时间归档

June 20262005 篇已发布文章

延伸阅读

AgentShield:四层安全锁,防止AI代理挥霍你的钱密歇根大学一位毕业生开发了AgentShield,一个四层安全系统,能阻止自主AI代理进行未经授权或恶意的支付。它在交易执行前通过验证意图、预算和行为异常来拦截交易——将代理的财务安全从事后补救转变为基础层保障。Kplane 隔离沙箱:AI 智能体安全最大盲点的终极解药Kplane 发布了一项颠覆性的云基础设施,为每个自主 AI 智能体提供独立的、一次性专用沙箱。这种设计直接消除了提示注入攻击和意外系统损坏的风险,有望在受监管行业中解锁企业级部署。Defender本地提示注入防御重塑AI智能体安全架构开源安全库Defender正从根本上改变AI智能体的安全格局。它通过本地实时防护机制对抗提示注入攻击,摆脱对外部安全API的依赖,构建可随智能体迁移的便携式安全边界,大幅降低了为自主系统实施强安全防护的门槛。Cordium 开源沙箱:让 AI 代理与基础设施密钥彻底“绝缘”一款名为 Cordium 的全新开源沙箱平台,通过让密钥“隐形”来颠覆基础设施安全。它基于 Kubernetes 构建,为人类开发者与 AI 代理提供基于身份的无密钥访问,有望解决困扰自主编码工作流的安全悖论。

常见问题

GitHub 热点“Lelu Open-Source Engine: The Runtime Firewall That Stops Hijacked AI Agents in Their Tracks”主要讲了什么?

The rise of autonomous AI agents—systems that call APIs, query databases, and execute shell commands—has introduced a critical security gap: once an agent is granted permissions, a…

这个 GitHub 项目在“Lelu engine vs Guardrails AI for agent security”上为什么会引发关注?

Lelu's core innovation lies in its runtime policy engine, which sits between the agent's reasoning loop and every external tool call. The architecture consists of three layers: 1. Policy Definition Layer: Policies are wr…

从“How to integrate Lelu with LangChain agents”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。