Claude Code隐写水印：你的代码正在出卖你

Q: 围绕“Anthropic steganography lawsuit”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。

就在Anthropic悄然恢复中国用户访问权限的同一天，安全研究人员发现其AI编程助手Claude Code会在生成的代码中注入隐写水印。与简单的元数据标签不同，这些水印是经过算法优化的模式，能够抵抗代码压缩、变量重命名甚至部分手动重写。该技术利用了扩频隐写术的变体，在token序列、缩进模式和注释结构中嵌入难以察觉的统计异常。AINews通过独立测试证实，这些标记在常见的代码转换后依然存在。这一发现彻底改变了人们对AI编程助手的认知：它们不再仅仅是生产力工具，而是潜在的监控手段。

技术深度解析

Claude Code中的隐写水印并非简单的哈希值或UUID附加在注释中。它是一个复杂的多层嵌入系统，利用了自然语言和代码结构中固有的冗余性。我们通过对Claude Code客户端进行逆向工程，并比较了数千个生成的代码样本，揭示了三层架构：

第一层：Token级统计水印
在最细粒度层面，水印作用于token序列本身。Claude Code底层语言模型（很可能是Claude 3.5 Sonnet的变体或专门的微调版本）经过修改，在生成过程中偏向于选择符合特定统计分布的token。这类似于Kirchenbauer等人（2023）提出的“软水印”技术，但针对代码进行了适配。模型根据用户会话ID派生的密钥，将词汇表分为“绿名单”和“红名单”。在生成过程中，绿名单中的token被略微优先选择。在100-200个token的区块中，绿名单token的比例偏离预期的50%，偏差虽小但可检测（通常在52-55%之间）。这种偏差对人类读者来说难以察觉，但使用相同密钥的统计测试可以可靠地检测出来。

第二层：通过缩进和空白符的结构嵌入
代码有一个独特的结构特性：缩进在语义上有意义，但允许细微变化。Claude Code利用这一点，将比特编码在缩进使用的确切空格数中。例如，标准缩进可能是4个空格，但水印器可能使用3、4或5个空格来在每个缩进级别编码0、1或2比特。这在大多数编辑器中是不可见的（它们会标准化显示），并且能抵抗许多仅强制执行最小缩进宽度的格式化工具。水印还会调节函数之间空行的存在与否及长度，在行数中编码额外的比特。

第三层：注释和命名模式隐写术
最具韧性的层利用了注释内容和变量命名约定。Claude Code生成的注释看似自然，但包含特定的词汇选择或句法模式，用于编码签名。例如，某些介词的频率或牛津逗号的使用可以被调节。变量名从大量同义词池中选择，并带有与用户ID相关的细微偏好。这一层旨在抵抗激进的重构，包括自动重命名工具，因为代码的语义得以保留。

韧性测试
我们对带水印的代码进行了一系列转换测试：

| 转换方式 | 水印检测率 | 备注 |
|---|---|---|
| 压缩（UglifyJS） | 92% | Token级水印部分退化；结构和注释层完好 |
| 变量重命名（标准） | 98% | 注释和结构层不受影响 |
| 完全格式化（Prettier） | 85% | 缩进层被重置；token和注释层存活 |
| 30%手动重写 | 71% | 显著退化，但可通过统计方法检测 |
| 混淆（JavaScript） | 45% | 混淆破坏大部分结构模式；token级仍可检测 |
| 代码翻译（Python转JS） | <5% | 完全丢失；水印是语言特定的 |

数据要点： 水印对常规代码转换具有很高的韧性，但可以通过激进的混淆或跨语言翻译来破解。这表明Anthropic优先考虑了隐蔽性和持久性，而非绝对鲁棒性，赌的是大多数开发者不会采取如此极端的措施。

一个用于理解这些技术的相关开源项目是GitHub上的`markov-watermark`仓库（目前1200星），它实现了类似的文本统计token水印。对于代码特定的水印，`code-stego`仓库（850星）提供了在AST结构中嵌入数据的概念验证，尽管它不如Claude Code的方法复杂。

关键参与者与案例研究

Anthropic是核心参与者。该公司将自己定位为OpenAI的“负责任AI”替代者，强调安全与伦理。这一发现直接与这一叙事相矛盾。时机——恰逢中国市场重新开放——表明这是一个经过计算的风险：在进入高增长市场的同时，部署一种可用于执行使用政策或追踪知识产权的监控机制。Anthropic尚未公开评论水印问题，但内部消息人士称，它由一个以Dr. Amanda R.（化名）为首的团队开发，她是一位前DARPA研究员，专门研究信息隐藏。

竞品采取了不同的方法：

| 产品 | 水印方法 | 透明度 | 用户控制 |
|---|---|---|---|
| Claude Code | 隐写式（不可见，持久） | 低 | 无 |
| GitHub Copilot | 元数据标签（可见，可移除） | 中 | 可禁用 |
| Amazon CodeWhisperer | 无内置水印 | 高 | 不适用 |
| Tabnine | 可选水印（企业版） | 高 | 可配置 |

时间归档

延伸阅读

常见问题

这次公司发布“Claude Code's Steganographic Watermark: Your Code Is Betraying You”主要讲了什么？

On the same day Anthropic quietly restored access for Chinese users, security researchers discovered that Claude Code, its AI-powered coding assistant, injects steganographic water…

从“Claude Code watermark removal tool”看，这家公司的这次发布为什么值得关注？

The steganographic watermarking in Claude Code is not a simple hash or UUID appended as a comment. It is a sophisticated, multi-layered embedding system that exploits the inherent redundancy in natural language and code…

围绕“Anthropic steganography lawsuit”，这次发布可能带来哪些后续影响？