Claude Code Bridge：多AI编排器，或将重塑开发工作流

2026年4月28日 18:09 AINews GitHub April 2026

⭐ 2379📈 +657

来源：GitHub AI development tools 归档：April 2026

一款名为 claude_code_bridge 的开源项目，正率先实现 Claude、Codex 与 Gemini 之间的实时协作，以极低的 Token 开销维持持久上下文。AINews 深入剖析：这个多智能体编排层，究竟是 AI 辅助开发未来的缩影，还是一次过度设计的实验？

开源仓库 bfly123/claude_code_bridge 迅速走红，已累计获得超过 2,300 颗星，单日峰值增长达 +657，彰显了开发者对多模型编排的浓厚兴趣。该工具充当中间件桥梁，允许开发者在同一会话中同时或依次调用 Anthropic 的 Claude、OpenAI 的 Codex 以及 Google 的 Gemini，并维护一个共享的持久上下文，从而大幅减少冗余的 Token 消耗。与每个模型重新处理整个对话历史不同，claude_code_bridge 采用压缩上下文窗口，仅存储关键状态变化，据称相比简单的多 API 链式调用可节省高达 60% 的 Token。其架构基于事件驱动循环，将提示路由至最优模型。

技术深度解析

claude_code_bridge 的核心是一个多智能体编排层（Multi-Agent Orchestration Layer，MAOL），它抽象了各个 LLM API 的独特差异。该架构围绕三大创新构建：

1. 持久上下文管理器（PCM）： 不同于将整个对话附加到每次 API 调用（这种标准做法会导致二次方级的 Token 成本），PCM 维护一个共享的状态图。它追踪每个模型贡献了哪些信息，并仅传递下一次推理所需的最小增量。这是通过一个自定义的 Token 感知差异算法实现的，该算法识别语义变化而非字符级编辑。早期基准测试表明，在多轮协作会话中，这可将上下文窗口使用量减少 40-60%。

2. 动态路由器： 路由器通过一个轻量级分类器（基于小型 BERT 模型）评估传入的提示，该分类器从三个维度对每个任务进行评分：推理深度、代码生成概率和多模态相关性。根据这些分数，提示被分派到最合适的模型。例如，要求“解释使用 B 树与哈希索引的权衡”的请求将被路由到 Claude，因其卓越的分析推理能力；而“编写一个实现 B 树的 Python 函数”则会被发送给 Codex。路由器还支持对可分解的任务进行并行分派——例如，同时生成代码及其文档。

3. Token 预算调度器： 该组件监控所有 API 调用的累计 Token 消耗，并动态调整 PCM 的压缩比率。当接近用户定义的预算阈值时，调度器会提高上下文剪枝的激进程度，可能丢弃低优先级的历史交流。这是一把双刃剑：它能防止成本失控，但也可能丢失后续可能需要的上下文。

性能基准测试（初步数据，来自项目的测试套件）：

| 指标 | 朴素多 API 链式调用 | claude_code_bridge | 改进幅度 |
|---|---|---|---|
| 每 10 轮会话总 Token 数 | 48,200 | 19,800 | 减少 59% |
| 每轮延迟（平均） | 3.2 秒 | 4.1 秒 | 增加 28% |
| 任务成功率（复杂推理） | 72% | 81% | +9% |
| 代码生成准确率（pass@1） | 64% | 73% | +9% |
| 每会话 API 成本（估算） | $0.48 | $0.21 | 减少 56% |

数据要点： Token 节省效果显著，直接转化为成本降低，但延迟代价不容忽视。任务成功率的提升表明，路由到专门模型优于依赖单一通用模型，但编排层的开销增加了摩擦。

该项目还与开源生态系统集成。它利用 `langchain` 库实现模型无关接口，但已将其分叉以添加自定义上下文管理钩子。截至本文撰写时，GitHub 仓库（bfly123/claude_code_bridge）已获得 2,379 颗星和 342 个分支，`context-compression` 分支的开发十分活跃。维护者已表示计划通过 Ollama 添加对本地模型的支持，这将减少 API 依赖，但会引入新的延迟挑战。

关键参与者与案例研究

该项目位于多个竞争生态系统的交汇点。Anthropic 的 Claude、OpenAI 的 Codex（现已集成到 GPT-4o）和 Google 的 Gemini 各有独特优势，claude_code_bridge 充分利用了这些优势：

- Claude（Anthropic）： 在长文本推理、安全对齐和细致指令遵循方面表现最佳。其 200K Token 的上下文窗口使其成为持久上下文管理器的理想选择。然而，其代码生成在特定语言（如 Python 或 JavaScript）上不如 Codex 优化。
- Codex（OpenAI）： 代码生成的金标准，尤其擅长 Python、TypeScript 和 SQL。它擅长将自然语言转换为可执行代码，但在需要深度领域知识的开放式推理任务上表现不佳。
- Gemini（Google）： 强大的多模态能力（图像、视频、音频）和具有竞争力的推理能力，但其 API 定价波动较大，上下文窗口较小（128K Token）。它充当涉及视觉输入任务的桥梁。

与 claude_code_bridge 相关的模型能力对比：

| 特性 | Claude 3.5 Sonnet | GPT-4o (Codex) | Gemini 1.5 Pro |
|---|---|---|---|
| 上下文窗口 | 200K Token | 128K Token | 128K Token |
| 代码生成（HumanEval） | 84.1% | 90.2% | 82.5% |
| 推理（MMLU） | 88.7% | 88.3% | 86.4% |
| 多模态 | 仅文本 | 文本 + 图像 | 文本 + 图像 + 音频 |
| API 成本（每 1M 输入 Token） | $3.00 | $5.00 | $3.50 |
| 速率限制（请求/分钟） | 50（Tier 4） | 10,000（Tier 5） | 2,000（标准） |

数据要点： 没有单一模型在所有维度上占据主导地位。Claude 拥有最大的上下文窗口和最佳推理能力，Codex 在代码生成方面领先，而 Gemini 提供多模态灵活性。

时间归档

常见问题

GitHub 热点“Claude Code Bridge: The Multi-AI Orchestrator That Could Reshape Development Workflows”主要讲了什么？

The open-source repository bfly123/claude_code_bridge has rapidly gained traction, accumulating over 2,300 stars with a daily spike of +657, signaling intense developer interest in…

这个 GitHub 项目在“How to set up multiple API keys for claude_code_bridge”上为什么会引发关注？

At its core, claude_code_bridge implements a Multi-Agent Orchestration Layer (MAOL) that abstracts away the idiosyncrasies of individual LLM APIs. The architecture is built around three key innovations: 1. Persistent Con…

从“claude_code_bridge vs LangChain for multi-model orchestration”看，这个 GitHub 项目的热度表现如何？

当前相关 GitHub 项目总星标约为 2379，近一日增长约为 657，这说明它在开源社区具有较强讨论度和扩散能力。

Claude Code Bridge：多AI编排器，或将重塑开发工作流

技术深度解析

关键参与者与案例研究

更多来自 GitHub

相关专题

时间归档

延伸阅读

常见问题