Sigil:为LLM提示词加上密码学签名,彻底杜绝篡改与注入攻击

Hacker News June 2026
来源:Hacker News归档:June 2026
Sigil是一个开源框架,通过对大语言模型提示词进行密码学签名,创建防篡改的审计追踪,并以作用域指令机制阻止注入攻击。AINews深度分析:这项技术如何成为企业AI的信任基石。

大语言模型的快速普及暴露了一个关键漏洞:提示词注入攻击——恶意行为者通过操控输入指令来劫持模型行为。新开源的Sigil框架直接回应这一挑战,将密码学签名嵌入提示词元数据中。它为每一次交互生成不可篡改的“数字指纹”,并通过“签名作用域”机制让开发者定义精确的行为边界。即使发生注入攻击,模型也能检测到越界指令并拒绝执行。对于金融、医疗等受监管行业,Sigil提供了一种合规就绪的解决方案:企业现在可以生成完整的审计日志,证明每一次模型调用都未被篡改。该架构还原生支持高性能验证,延迟开销仅为2-5毫秒。

技术深度解析

Sigil的核心创新在于为LLM提示词添加了一层密码学签名——不是作为包装器,而是作为提示词元数据结构的有机组成部分。该框架采用非对称密钥密码学:开发者持有的私钥对提示词内容及其声明的“作用域”(例如“仅回答产品文档相关问题,绝不执行系统命令”)进行签名。对应的公钥嵌入模型运行环境,使LLM在处理前能够验证签名。

架构与工作流:
1. 提示词准备: 开发者构建提示词并定义其作用域——一份机器可读的策略,描述允许的操作、数据访问边界和禁止行为。
2. 签名: 框架对提示词内容加上作用域策略进行哈希,然后使用开发者的私钥对该哈希值签名。签名和公钥作为元数据附加到提示词中。
3. 验证: 当LLM收到提示词时,验证模块(通过轻量级插件或API中间件集成)对照作用域策略检查签名。如果签名无效或提示词已被篡改,模型返回错误。
4. 执行: 仅通过验证的提示词才会被处理,模型行为受签名作用域约束——任何违反作用域的注入指令都将被忽略。

GitHub仓库: Sigil项目托管在GitHub上的仓库 `sigil-ai/sigil`。截至2026年6月,已获得超过4200颗星和340个复刻。仓库包含Python SDK、用于签名提示词的CLI工具,以及针对OpenAI、Anthropic和通过llama.cpp运行的本地模型的集成示例。核心验证模块用Rust编写以保证性能,并提供了Python和JavaScript绑定。

性能基准测试: Sigil为每次提示词的签名和验证引入约2-5毫秒的延迟开销,具体取决于密钥大小和哈希算法。下表比较了Sigil与其他提示词安全方法的开销:

| 安全方法 | 延迟开销 | 防篡改能力 | 作用域强制执行 | 审计追踪 | 开源 |
|---|---|---|---|---|---|
| Sigil | 2-5毫秒 | 密码学(强) | 是(基于策略) | 是(不可篡改日志) | 是 |
| 输入清洗(正则/LLM基础) | 10-50毫秒 | 中等(可绕过) | 否 | 否 | 视情况而定 |
| 提示词隔离(沙箱) | 100-500毫秒 | 强(系统级) | 隐式 | 否 | 部分 |
| 无安全措施 | 0毫秒 | 无 | 无 | 无 | — |

数据要点: Sigil在低延迟和强密码学安全之间提供了最佳平衡,而其作用域强制执行和审计追踪能力在当前方法中独一无二。输入清洗成本更低但本质上可被攻破;沙箱虽稳健但过于沉重。

关键参与者与案例研究

Sigil由一群前Cloudflare安全工程师和剑桥大学安全小组的研究人员共同开发。首席开发者Elena Voss博士曾参与TLS 1.3标准化工作,并发表过关于密码学协议形式化验证的论文。该项目获得由多家AI安全与网络安全风投组成的财团提供的320万美元种子轮融资。

竞品方案: 尽管多家公司提供提示词安全产品,但没有一家将密码学签名与作用域强制执行相结合:

| 产品/项目 | 方法 | 关键差异化 | 目标客户 | 定价 |
|---|---|---|---|---|
| Sigil | 密码学签名 + 作用域策略 | 防篡改审计,开源 | 企业、受监管行业 | 免费(开源);计划推出企业支持 |
| PromptGuard(某大型云服务商) | 基于机器学习的异常检测 | 实时威胁评分 | 云原生应用 | 每百万提示词0.50美元 |
| SecurePrompt(初创公司) | 沙箱化执行环境 | 隔离模型实例 | 高安全部署 | 每百万提示词2.00美元 |
| Guardrails AI | 基于规则的输出过滤 | 预构建合规模板 | 通用LLM应用 | 每百万token 0.10美元 |

数据要点: Sigil是唯一提供密码学防篡改证据和作用域强制执行的开源方案。其最接近的竞争对手依赖统计或沙箱方法,无法提供同等水平的可验证信任。

案例研究——金融合规: 一家中型金融科技公司FinSecure集成Sigil以遵守SEC法规,该法规要求对所有AI生成的金融建议保留审计追踪。通过签署提示词,将模型限制为仅使用经批准的数据源且绝不生成买入/卖出建议,FinSecure为每一次交互创建了可验证的日志。在一次审计中,他们证明了50,000条提示词100%经过签名且未被篡改,无需人工审查便满足了监管机构要求。

行业影响与市场动态

提示词安全市场预计将从2025年的12亿美元增长至2030年的87亿美元,这一增长受到监管推动。

更多来自 Hacker News

无标题DeepSeek's latest update introduces native visual perception, allowing the model to process and reason over images, diag本地隐私盾:这款开源应用在AI“看到”数据前,就已剥离所有个人敏感信息随着ChatGPT、Claude、Gemini等AI工具深度嵌入日常工作流程,一个根本性的矛盾日益凸显:用户既想享受大语言模型的强大能力,又不想暴露敏感数据。一款全新的开源桌面应用直接回应了这一痛点——它在任何文本被发送至AI服务之前,完全GLM-5.2 击穿开源天花板:纯文本模型正面叫板闭源巨头GLM-5.2 的发布标志着开源 AI 的一个分水岭时刻。由智谱 AI 开发的这款纯文本大语言模型,在 MMLU-Pro、GPQA 和 MATH-500 等关键基准测试中均斩获最高分,超越所有其他开源模型,并与 GPT-4o 和 Claud查看来源专题页Hacker News 已收录 4856 篇文章

时间归档

June 20261734 篇已发布文章

延伸阅读

Anchor:零依赖幻觉检测器,为LLM装上“真相开关”Anchor,一款全新的开源Python工具,无需任何外部依赖即可检测大语言模型的幻觉输出,承诺实现即插即用的工作流集成。AINews深度解析:这种极简设计哲学如何重新定义AI可靠性,推动行业从参数军备竞赛转向信任基础设施建设。AgentShield:四层安全锁,防止AI代理挥霍你的钱密歇根大学一位毕业生开发了AgentShield,一个四层安全系统,能阻止自主AI代理进行未经授权或恶意的支付。它在交易执行前通过验证意图、预算和行为异常来拦截交易——将代理的财务安全从事后补救转变为基础层保障。AI智能体学会自卫:运行时安全成为新战场自主AI智能体正在执行代码、调用API、操作数据库——而攻击者已经开始利用它们。行业正从部署前的安全过滤器转向运行时自我防御,智能体必须实时检测并拒绝提示注入、系统劫持和对抗性输入。Kplane 隔离沙箱:AI 智能体安全最大盲点的终极解药Kplane 发布了一项颠覆性的云基础设施,为每个自主 AI 智能体提供独立的、一次性专用沙箱。这种设计直接消除了提示注入攻击和意外系统损坏的风险,有望在受监管行业中解锁企业级部署。

常见问题

GitHub 热点“Sigil: Cryptographic Signing for LLM Prompts Prevents Tampering and Injection Attacks”主要讲了什么?

The rapid adoption of large language models has exposed a critical vulnerability: prompt injection attacks, where malicious actors manipulate input instructions to hijack model beh…

这个 GitHub 项目在“Sigil vs PromptGuard comparison”上为什么会引发关注?

Sigil's core innovation is a cryptographic signing layer applied to LLM prompts, not as a wrapper but as an integral part of the prompt's metadata structure. The framework uses asymmetric key cryptography: a private key…

从“Sigil prompt injection defense GitHub”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。