Claude Code源码泄露暴露AI工具链安全漏洞

2026年5月11日 09:48 AINews GitHub May 2026

⭐ 14

来源：GitHub Claude Code Anthropic 归档：May 2026

Anthropic在发布Claude Code 0.2.8时意外开启内联源码映射，导致22MB的生产包变成可逆源码泄露。尽管迅速下架，但GitHub上已出现完整重构代码库，揭示了Claude的代理架构和CLI内部结构。

2025年3月，Anthropic发布了Claude Code，这是一款用于AI辅助开发的命令行工具，与Claude 3.7一同推出。该npm包基于Node.js构建，本应是生产就绪的工具。然而，版本0.2.8意外启用了`inline-source-map`功能，这一仅限开发阶段的特性将完整的源码映射直接嵌入到.mjs包中。结果是一个22MB的文件，可以轻松反向工程还原为可读源码，完全绕过了任何混淆措施。Anthropic迅速从npm中移除了所有0.2.8版本，并发布了修复问题的0.2.9版本。但损害已经造成：开发者dnakov在GitHub上发布了一个名为claude-code的仓库，包含了从0.2.8重构的完整源码。这个仓库已成为研究人员和安全审计员的宝贵资源，提供了对Claude代理架构和CLI内部机制前所未有的洞察。

技术深度解析

核心问题在于Node.js打包器如何处理源码映射。在构建生产包时，开发者通常使用单独的`.map`文件或完全禁用源码映射。`inline-source-map`会将整个源码映射作为Base64编码的数据URL嵌入到包末尾。对于一个22MB的文件，源码映射部分可能占60-70%的大小。源码映射包含原始源码、文件路径和变量名——一切重建未压缩源码所需的信息。

在Claude Code 0.2.8中，包是通过esbuild或rollup等工具构建的，Webpack配置中设置了`devtool: 'inline-source-map'`。这是开发者忘记切换至生产模式时的常见错误。生成的`.mjs`文件，只要在浏览器DevTools或Node.js调试器中打开，就会显示完整的源码树。

GitHub仓库`dnakov/claude-code`（14颗星，在撰写时每日新增0颗）提供了重构后的源码。分析显示其包含多个架构细节：

- 代理循环：核心循环采用状态机模式，使用`AgentState`枚举（IDLE, THINKING, TOOL_CALL, WAITING_FOR_USER）。每个状态根据LLM响应和工具输出进行转换。
- 工具注册表：工具定义为继承自`BaseTool`接口的类，包含`execute()`、`getSchema()`和`validate()`方法。注册表包括`bash`、`read_file`、`write_file`、`search_code`和`web_search`等工具。
- 提示构建：系统提示由多个模板文件动态组装而成，包括`agent_system_prompt.md`、`tool_descriptions.md`和`user_context.md`。模板使用Handlebars风格的占位符。
- 上下文管理：代码显示了一个复杂的上下文窗口管理系统，根据标记计数截断对话历史，采用滑动窗口方法，优先保留最近的工具输出。
- 错误处理：有有趣的重试机制，API调用采用指数退避策略，如果Claude 3.7不可用则回退到更简单的模型。

数据表：包大小对比

| 版本 | 包大小 | 包含源码映射 | 重构代码行数 | 文件数量 |
|---------|-------------|---------------------|-------------------------------|------------|
| 0.2.8（泄露） | 22 MB | 是（内联） | ~45,000 | 127 |
| 0.2.9（修复） | 4.1 MB | 否 | N/A（压缩） | 1 |
| 0.3.0（当前） | 3.8 MB | 外部.map | N/A（压缩） | 2 |

数据要点： 从0.2.8到0.2.9的5倍大小减少几乎完全归因于移除了内联源码映射。实际应用逻辑仅约4MB，意味着泄露包中的18MB纯属源码映射数据。这是一种巨大的低效性，也造成了安全漏洞。

该仓库还揭示了Claude Code使用了一个自定义的`PromptBuilder`类，通过读取`prompts/`目录构建提示。该目录包含超过30个模板文件，针对不同场景（代码生成、调试、重构）进行了优化。模板以Markdown和JSON混合编写，嵌入JavaScript表达式以实现动态内容。

关键人物与案例研究

Anthropic是此事件的主要参与者。该公司将Claude Code定位为GitHub Copilot CLI和Cursor终端代理的直接竞争对手。Anthropic的战略重点在于强调安全性和可解释性，因此此次源码泄露尤其尴尬。公司回应——在数小时内下架包——显示出其意识，但也揭示了其反应性的安全姿态。

dnakov是发布重构源码的GitHub用户，很可能是一位安全研究员或AI爱好者。该仓库描述明确表示其用途为“研究和教育目的”。这与2023年LLaMA权重通过BitTorrent泄露的类似事件相呼应，当时一款旨在受控访问的模型被广泛分发。

竞争工具：

| 工具 | 公司 | 语言 | 包大小 | 开源 | 源码映射处理 |
|------|---------|----------|-------------|-------------|---------------------|
| Claude Code 0.2.8 | Anthropic | Node.js | 22 MB（泄露） | 否（但泄露） | 内联（泄露） |
| Claude Code 0.2.9+ | Anthropic | Node.js | ~4 MB | 否 | 外部.map |
| GitHub Copilot CLI | Microsoft | Go | ~15 MB | 否 | 无源码映射 |
| Cursor CLI | Anysphere | TypeScript | ~8 MB | 否 | 无源码映射 |
| Open Interpreter | 社区 | Python | ~2 MB | 是（MIT） | N/A（Python） |

数据要点： 即使修复了泄露问题，Claude Code的包大小仍大于竞争对手。这表明Anthropic捆绑了更多依赖项或拥有更复杂的代理循环。Open Interpreter（社区项目）完全开源且更小，给Anthropic带来了压力，要求其证明包的大小合理性。

行业影响与市场动态

此次事件产生了多方面的连锁反应：

时间归档

常见问题

GitHub 热点“Claude Code Blunder Exposes Raw Source: A Security Wake-Up for AI Toolchains”主要讲了什么？

On March 2025, Anthropic released Claude Code, a command-line tool for AI-assisted development, alongside Claude 3.7. The npm package, built with Node.js, was meant to be a product…

这个 GitHub 项目在“Claude Code source code leak reverse engineering tutorial”上为什么会引发关注？

The core issue lies in how Node.js bundlers handle source maps. When building a production package, developers typically use source-map in a separate .map file or disable it entirely. inline-source-map embeds the entire…

从“How to detect inline source maps in npm packages”看，这个 GitHub 项目的热度表现如何？

当前相关 GitHub 项目总星标约为 14，近一日增长约为 0，这说明它在开源社区具有较强讨论度和扩散能力。

Claude Code源码泄露暴露AI工具链安全漏洞

技术深度解析

关键人物与案例研究

行业影响与市场动态

更多来自 GitHub

相关专题

时间归档

延伸阅读

常见问题