LLM隐写术:AI文本如何在众目睽睽之下隐藏秘密信息

Hacker News May 2026
来源:Hacker News归档:May 2026
一项名为Calgacus-MLX的开源项目展示了大型语言模型如何通过令牌选择将秘密信息嵌入看似正常的文本中,在不改变表面语义的前提下编码二进制位。这项技术为隐私保护和隐蔽通信开辟了双重用途,同时也对AI安全边界提出了新的挑战。

Calgacus-MLX项目标志着隐写术领域的一次范式转变,它利用了大型语言模型固有的概率特性。与依赖修改图像或音频等现有媒体的传统方法不同,这种方法利用了LLM在给定上下文中生成的多个合理令牌延续。秘密信息的二进制位被映射到这些候选令牌中的特定选择上,从而生成读起来自然但携带隐藏载荷的文本。其关键创新在于LLM生成文本的统计随机性,这使得传统统计分析几乎无法检测。这一能力具有深远影响:对记者和活动家而言,它提供了对抗审查的有力工具;对安全监管机构而言,它创造了一个难以监控的通信渠道。

技术深度解析

Calgacus-MLX项目实现了一种令牌级隐写术,利用了自回归语言模型的概率输出分布。其核心技术原理如下:

1. 上下文编码:发送者向LLM提供一个提示(例如,“写一封关于项目更新的简短邮件”)。
2. 令牌选择:对于生成文本中的每个位置,模型计算词汇表上的概率分布。发送者选择一个子集——通常是top-k或top-p候选——这些令牌在上下文中语义等价(例如,“progress”、“advancement”、“development”)。
3. 比特映射:秘密信息的二进制位被映射到这些候选令牌上。例如,比特'0'可能映射到“progress”,比特'1'映射到“advancement”。发送者强制模型输出与下一个比特对应的令牌。
4. 解码:接收者知道相同的映射,并使用相同的LLM,为每个令牌重新生成候选集,并从所选令牌中读取比特。

关键架构组件
- Calgacus-MLX(GitHub: `calgacus/calgacus-mlx`)基于Apple的MLX框架构建,针对Apple Silicon优化。它使用一个小型LLM(例如,7B参数模型)的微调变体,并带有自定义解码循环,用隐写采样器替代了标准的贪婪/top-k采样。
- 该项目的GitHub仓库(近期已超过1,200颗星)包含一个`steg_sampler.py`模块,实现比特到令牌的映射,以及一个`steg_encoder.py`用于嵌入消息。
- 容量:该方法大约每生成一个令牌嵌入1比特。对于一封500令牌的邮件,这产生约62字节的隐藏数据——足以容纳一条短消息或加密密钥。

性能基准测试

| 指标 | Calgacus-MLX (7B) | 传统LSB图像隐写术 | GPT-4o隐写术(理论值) |
|---|---|---|---|
| 嵌入速率 | ~1比特/令牌 | ~3比特/像素(24位图像) | ~1.5比特/令牌(估计) |
| 检测抵抗性 | 高(与正常LLM输出统计上不可区分) | 低(可检测到统计异常) | 非常高(如果使用相同模型) |
| 每100令牌延迟 | 2.3秒(M2 Ultra) | 0.1秒(CPU) | 5.1秒(API调用) |
| 载荷容量(500令牌) | 62.5字节 | ~2.3 MB(1080p图像) | 93.75字节 |

数据要点:虽然容量远低于基于图像的隐写术,但检测抵抗性显著更高,因为LLM生成的文本自然表现出与正常LLM输出相同的统计模式。对于电子邮件或聊天等实时应用,延迟权衡是可以接受的。

底层机制:该方法依赖于LLM输出分布的。高熵上下文(例如,创意写作)提供许多候选令牌,从而实现更高的嵌入速率。低熵上下文(例如,事实陈述)限制了选择,降低了容量。该项目包含一个`context_entropy_estimator.py`,根据提示的熵动态调整嵌入速率。

关键参与者与案例研究

主要参与者是Calgacus团队(匿名化名贡献者),他们于2025年初以MIT许可证发布了该项目。他们不隶属于任何主要AI实验室,将自己定位为专注于隐私工具的独立研究人员。

竞争方法

| 解决方案 | 方法 | 优势 | 劣势 | GitHub星数 |
|---|---|---|---|---|
| Calgacus-MLX | 令牌级选择 | 高检测抵抗性,开源 | 低容量,需要相同LLM | ~1,200 |
| StegaLLM(Meta AI Research) | 使用隐写损失进行微调 | 更高容量,模型无关 | 需要重新训练,可被专门分类器检测 | ~800 |
| TextHide(学术) | 同义词替换 | 简单,无需LLM | 容易被基于NLP的隐写分析检测 | ~300 |
| GPT-Steg(社区) | 提示工程 | 无需代码更改 | 不可靠,低容量 | ~150 |

数据要点:Calgacus-MLX在检测抵抗性方面领先,因为它与LLM采样原生集成,但StegaLLM通过模型微调提供了更高容量。隐蔽性与载荷大小之间的权衡是核心设计张力。

案例研究:威权政权下的记者
一位假设的记者使用Calgacus-MLX将举报人文档哈希嵌入一篇关于园艺的公开博客文章中。该文章通过了审查过滤器,因为它读起来像正常的LLM生成内容。接收者使用相同的模型和共享密钥,提取哈希并验证文档。这展示了保护隐私的潜力。

案例研究:恶意软件C2信道
一个威胁行为者将命令与控制指令嵌入来自合法公司基于LLM的聊天机器人的自动客户服务回复中。隐藏的命令指示受感染的机器窃取数据。文本看起来像正常的支持响应,从而规避了网络监控工具。

更多来自 Hacker News

AI代理密钥困境:动态权限为何成为下一个安全前沿从客服机器人到代码生成助手,自主AI代理的快速普及暴露了一个根本性安全缺陷:传统凭证管理。API密钥本是为人类发起、受监督的调用而设计,如今却被每秒可执行数百次操作且无需人工审核的代理压垮。这一“密钥困境”并非理论假设:因代理提示词泄露凭证微软承认Copilot键设计失败:强行将AI塞给用户,只会打乱工作流在一份不同寻常的自我批评中,微软承认Windows 11键盘上新增的专用Copilot键正给相当一部分用户带来真实摩擦。这颗被设计为AI助手一键入口的按键,被发现与自定义键盘快捷键、宏命令乃至基础文本编辑操作产生冲突。这并非简单的软件漏洞,AI 造出“不可能”的乐器:虚拟博物馆如何重新定义音乐虚拟乐器博物馆并非实体收藏,而是一个由人工智能孕育的、活生生的数字乐器库。这些乐器并非真实乐器的采样,而是全新的创造——琴弦因引力波而振动,鼓在四维空间中共鸣,管弦乐音色能根据演奏者的情绪状态改变音质。该项目利用了基于声音物理学、和声数学以查看来源专题页Hacker News 已收录 3571 篇文章

时间归档

May 20261934 篇已发布文章

延伸阅读

漏洞悬赏计划如何铸就2026年企业AI的安全脊梁AI安全的前线已从内部红队转向公共漏洞悬赏平台。从最初的简单提示词注入测试,到如今已演变为一个成熟的生态系统,深入探测模型推理、智能体行为及多模态系统的深层漏洞。这股外部压力正迫使安全AI的构建方式进行根本性重塑。AI代理密钥困境:动态权限为何成为下一个安全前沿AI代理能力爆发式增长,却催生了一个严峻的安全悖论:权限越大,灾难性滥用的风险越高。专为人类监督设计的静态API密钥已无力招架。一种全新范式——动态权限中间件——正崛起为安全领域从静态向自适应转型的关键。AI Foundry 推出无限推理订阅服务,或颠覆大模型定价模式AI Foundry 推出了一项基于 NVIDIA Blackwell GPU 的固定月费无限 LLM 推理订阅服务,直接挑战当前主流的按 token 计费模式。此举瞄准了需要高频 AI 工作负载且追求可预测成本的开发者和企业,可能标志着 Java的AI逆袭:为什么“无聊”的语言在LLM时代反而赢了当大语言模型重塑软件开发格局时,曾被诟病冗长乏味的Java,正出人意料地成为企业级AI应用的强力引擎。其严谨的结构与AI的模式匹配能力完美契合,大幅减少幻觉错误,提升代码可靠性。

常见问题

GitHub 热点“LLM Steganography: How AI Text Hides Secret Messages in Plain Sight”主要讲了什么?

The Calgacus-MLX project marks a paradigm shift in steganography by leveraging the inherent probabilistic nature of large language models. Unlike traditional methods that rely on m…

这个 GitHub 项目在“How to use Calgacus-MLX for secure messaging”上为什么会引发关注?

The Calgacus-MLX project implements a form of token-level steganography that exploits the probabilistic output distribution of autoregressive language models. At its core, the technique works as follows: 1. Context Encod…

从“LLM steganography detection methods comparison”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。