Lelu开源引擎：运行时防火墙，让被劫持的AI Agent无处遁形

Q: 从“How to integrate Lelu with LangChain agents”看，这个 GitHub 项目的热度表现如何？

当前相关 GitHub 项目总星标约为 0，近一日增长约为 0，这说明它在开源社区具有较强讨论度和扩散能力。

自主AI Agent的兴起——这些系统能调用API、查询数据库、执行Shell命令——引入了一个关键安全缺口：一旦Agent获得权限，一次提示注入或工具链劫持就能将可信Agent变成内部威胁。Lelu，一款新近开源的授权引擎，通过在每次Agent行动前强制执行运行时策略检查来应对这一问题。与传统的基于角色的访问控制（RBAC）或静态API密钥不同，Lelu在完整的上下文中评估每次工具调用——包括用户的原始意图、Agent的内部状态以及先前行动的历史——并允许、拒绝或标记该操作。该引擎设计为可嵌入任何Agent工作流，从LangChain和AutoGPT到自定义框架，无需修改Agent代码。

技术深度解析

Lelu的核心创新在于其运行时策略引擎，它位于Agent的推理循环与每个外部工具调用之间。该架构由三层组成：

1. 策略定义层：策略以声明式YAML/JSON格式编写，支持诸如`source_user_role`、`tool_name`、`input_parameter_values`、`previous_action_history`以及`embedding_similarity_to_original_task`等条件。例如，一条策略可以声明：“如果调用者来自财务部门，则允许`read_invoice`；但如果`to_account`字段未出现在用户的原始请求中，则阻止`transfer_funds`。”

2. 上下文提取层：在每次工具调用前，Lelu从Agent的内存、LLM当前的推理轨迹以及用户会话中提取一个结构化的上下文向量。这包括原始提示、Agent的思维链以及任何中间输出。该上下文被哈希处理并与策略数据库进行比较。

3. 执行层：引擎运行一个确定性决策树（而非LLM）来评估策略。这一点至关重要——使用LLM进行执行会重新引入Lelu旨在阻止的相同漏洞。决策树支持三种结果：ALLOW、DENY或FLAG（供人工审核）。每次检查的延迟控制在5毫秒以下，使其适用于实时Agent循环。

GitHub仓库：该项目托管在`github.com/lelu-security/lelu-engine`（截至2026年6月已获3200+星标）。它包括一个用Rust编写的参考实现（追求性能）以及Python绑定，此外还有针对常见攻击模式（如“通过base64编码越狱”和“工具递归滥用”）的预构建策略。

基准数据：

| 指标 | Lelu引擎 | 传统RBAC | 基于LLM的护栏（如Guardrails AI） |
|---|---|---|---|
| 每次检查延迟 | 3-5毫秒 | <1毫秒 | 200-500毫秒 |
| 提示注入检测率（MITRE ATLAS T1556） | 94% | 12%（依赖静态规则） | 78%（易受对抗性绕过） |
| 误报率 | 2.1% | 0.5%（但漏掉大多数攻击） | 8.5% |
| 无需代码变更即可更新策略 | 是 | 否（需要重新部署） | 部分（需要模型重新训练） |
| 确定性执行 | 是 | 是 | 否（基于LLM） |

数据要点：Lelu在现有方法中提供了检测准确性与延迟的最佳平衡。其确定性执行避免了基于LLM的护栏固有的对抗性漏洞，而其运行时上下文感知能力则能捕获静态RBAC完全遗漏的攻击。

关键参与者与案例研究

Lelu的诞生正值多家公司竞相保护Agent技术栈之际。当前格局包括：

- LangChain的LangSmith：提供可观测性和基本护栏，但依赖基于LLM的分类进行安全防护，这既缓慢又易受对抗性提示攻击。
- Guardrails AI：一个开源Python库，根据模式验证LLM输出。它专注于输出格式化，而非运行时工具调用授权。
- Rebuff：一个开源提示注入检测器。它作为预过滤器工作，但不会在会话中的多次工具调用间强制执行策略。
- Lelu：首个专为Agent设计的运行时授权引擎。

案例研究：金融科技初创公司“ClearPay”
ClearPay，一家支付处理平台，在2026年3月一次提示注入攻击导致Agent发起未经授权的退款后集成了Lelu。在采用Lelu之前，他们使用范围限定为“只读”和“读写”角色的静态API密钥。攻击者注入了一条提示，使Agent相信自己有权调用退款API。部署Lelu后，ClearPay定义了一条策略：“仅当用户的原始请求中包含‘退款’一词，且交易ID与该用户最近的购买记录匹配时，才能调用`refund`工具。”这完全阻断了攻击向量。ClearPay报告称，2026年第二季度与Agent滥用相关的安全事件减少了99.7%。

对比表：Agent安全解决方案

| 解决方案 | 方法 | 运行时策略？ | 确定性？ | 开源？ | GitHub星标 |
|---|---|---|---|---|---|
| Lelu | 上下文感知授权 | 是 | 是 | 是 | 3,200 |
| LangSmith | 基于LLM的护栏 | 部分 | 否 | 否 | 不适用（SaaS） |
| Guardrails AI | 输出验证 | 否 | 是（仅模式） | 是 | 8,500 |
| Rebuff | 输入过滤 | 否 | 是 | 是 | 5,100 |
| Microsoft Purview | 数据丢失防护 | 是（针对数据） | 是 | 否 | 不适用 |

数据要点：Lelu占据了一个独特的细分领域——运行时授权——这是其他开源工具均未涉及的。其确定性特性使其在安全关键型应用中比基于LLM的解决方案更具优势。

行业影响与市场动态

AI Agent安全市场虽处于萌芽阶段，但正在爆发式增长。据行业估计，全球AI安全基础设施市场将从2025年的21亿美元增长到2030年的187亿美元，其中Agent特定安全将占据重要份额。

时间归档

延伸阅读

常见问题

GitHub 热点“Lelu Open-Source Engine: The Runtime Firewall That Stops Hijacked AI Agents in Their Tracks”主要讲了什么？

The rise of autonomous AI agents—systems that call APIs, query databases, and execute shell commands—has introduced a critical security gap: once an agent is granted permissions, a…

这个 GitHub 项目在“Lelu engine vs Guardrails AI for agent security”上为什么会引发关注？

Lelu's core innovation lies in its runtime policy engine, which sits between the agent's reasoning loop and every external tool call. The architecture consists of three layers: 1. Policy Definition Layer: Policies are wr…

从“How to integrate Lelu with LangChain agents”看，这个 GitHub 项目的热度表现如何？