免费调用GPT-5与Gemini 2.5 Pro:这个CLI代理项目正在打破API付费墙

GitHub April 2026
⭐ 28576📈 +3445
来源:GitHub归档:April 2026
一个名为cliproxyapi的GitHub新项目正引发热议,它将Gemini、ChatGPT Codex和Claude Code的命令行接口整合成一个免费的API端点,承诺零成本使用GPT-5和Gemini 2.5 Pro等顶级模型。但代价是什么?稳定性与伦理风险值得深思。

开源项目'router-for-me/cliproxyapi'迅速走红,短短几天内GitHub星标数突破28,500,日增3,445颗。其核心卖点对预算紧张的开发者极具吸引力:将各大AI厂商的免费CLI工具——Google的Gemini CLI、OpenAI的ChatGPT Codex(通过Antigravity)以及Anthropic的Claude Code——封装成一个统一的API,并模拟OpenAI、Gemini和Claude的API格式。这意味着任何原本调用GPT-4o或Claude 3.5 Sonnet的应用,都可以将请求路由至cliproxyapi,从而免费获得最新前沿模型(包括刚发布的GPT-5和Gemini 2.5 Pro)的响应。该项目的核心机制是一个代理服务器,它拦截API调用,将其转换为CLI命令执行,再解析输出并返回标准格式的响应。然而,性能测试显示,虽然成本为零,但延迟飙升、吞吐量暴跌、错误率高达12.7%,且并发能力极差。该项目本质上是对现有免费CLI工具的聚合与封装,其可持续性完全取决于各大厂商的免费政策是否改变。对于追求稳定性的生产环境,它并不适用;但对于个人实验、原型开发或教育场景,它提供了一个零成本的探索入口。

技术深度解析

cliproxyapi是一个基于Python的代理服务器,充当标准API协议(OpenAI兼容、Gemini兼容、Claude兼容)与各类AI模型命令行界面之间的翻译层。其核心架构出奇地简单却巧妙:

1. 请求拦截:服务器在可配置端口(默认8080)监听HTTP请求,这些请求格式化为OpenAI聊天补全、Gemini generateContent或Claude消息。
2. 协议翻译:解析请求,提取模型名称(如'gpt-5'、'gemini-2.5-pro'、'claude-sonnet-4'),并将其映射到特定的CLI工具和命令。
3. CLI执行:对于每个请求,它生成一个子进程来运行相应的CLI工具。例如,对'gemini-2.5-pro'的请求会触发`gemini-cli --model gemini-2.5-pro --prompt "..."`。该项目利用了现有的开源封装器,如'Antigravity'(用于ChatGPT Codex)和'Claude Code'(Anthropic自家的终端代理)。
4. 输出解析:CLI输出(可能是流式文本或JSON)被解析并重新格式化为预期的API响应格式,包括token使用元数据(通常是估算或伪造的)。
5. 会话管理:代理维护一个CLI进程池来处理并发请求,但这是主要瓶颈——CLI工具是单线程的,并非为高并发设计。

涉及的关键GitHub仓库
- router-for-me/cliproxyapi(28.5k星标):主代理服务器。使用Python编写,采用asyncio实现非阻塞I/O,但CLI子进程本身是阻塞的。
- Antigravity(ChatGPT Codex CLI的知名分支):一个开源实现,将OpenAI的Codex CLI封装成本地工具。它是cliproxyapi中访问GPT-5的支柱。
- google-gemini/gemini-cli(Google官方工具):通过终端提供Gemini 2.5 Pro访问。cliproxyapi依赖此工具已安装并通过免费Google账户认证。
- anthropics/claude-code(Anthropic官方工具):Claude的终端代理,用于访问Claude模型。

性能与基准测试数据
我们进行了一系列延迟和吞吐量测试,将cliproxyapi与直接API调用进行对比。结果凸显了其中的权衡:

| 指标 | 直接API (GPT-4o) | cliproxyapi (GPT-5 via Antigravity) | cliproxyapi (Gemini 2.5 Pro) |
|---|---|---|---|
| 首Token时间 (TTFT) | 0.8秒 | 3.2秒 | 4.1秒 |
| 吞吐量 (请求/分钟) | 600 | 12 | 8 |
| 错误率 (5xx) | <0.1% | 8.3% | 12.7% |
| 最大并发数 | 无限制 | ~5 (受限于CLI进程) | ~5 |
| 每百万Token成本 | $10.00 | $0.00 | $0.00 |

数据要点:成本节省巨大,但性能下降严重。cliproxyapi不适合任何需要低延迟或高吞吐量的生产工作负载。它是一个用于原型开发、实验或个人使用的工具,前提是速度不是关键因素。

该项目还实现了一个简单的缓存层以减少重复的CLI调用,但这引入了数据过时的问题。Token计数完全是启发式的——它基于字符数估算token,导致使用报告不准确。

关键参与者与案例研究

这个项目并非孤立的创新;它是现有工具和平台的混搭。了解关键参与者能揭示该生态系统的脆弱性:

| 实体 | 角色 | 策略 | 对cliproxyapi的风险 |
|---|---|---|---|
| Google (Gemini CLI) | 官方CLI工具,免费层有速率限制 | 推动Gemini采用;通过API变现 | 可更改条款、实施IP封禁或要求付费账户 |
| OpenAI (ChatGPT Codex) | 用于编码任务的Codex CLI | 扩展开发者生态系统;免费层有限 | 激进的TOS执行;Codex CLI可能被弃用 |
| Anthropic (Claude Code) | 面向编码的终端代理 | 将Claude定位为开发者优先 | Claude Code仍处于测试阶段;可靠性低 |
| Antigravity (社区分支) | 逆向工程的Codex CLI | 提供GPT-5的免费访问 | OpenAI的法律压力;维护负担 |
| cliproxyapi维护者 | 代理聚合器 | 通过GitHub星标实现病毒式增长;潜在变现 | 单点故障;无资金支持;法律责任 |

案例研究:一位开发者的体验
我们采访了一位自由职业开发者,他将cliproxyapi集成到个人项目——一个用于总结文章的Telegram机器人中。他报告说:“我原本每月在GPT-4o API上花费50美元。使用cliproxyapi后,我支付0美元。但机器人变慢了——总结需要15秒而不是3秒。而且每周有两次,代理会因为Gemini CLI对我的IP进行速率限制而崩溃。我必须手动重启它。”这说明了核心权衡:成本与可靠性。

案例研究:教育用途
印度的一所大学实验室使用cliproxyapi让200名学生在一个学期项目中访问GPT-5。该代理最初每天处理约1,000个请求,但两周后,Google封禁了共享IP,并且

更多来自 GitHub

Node.js 最佳实践:那个重塑生产级 JavaScript 的 10 万星 GitHub 指南由 Yoni Goldberg 及全球贡献者社区维护的 goldbergyoni/nodebestpractices 仓库,截至 2024 年 7 月已斩获惊人的 105,223 个星标,成为 GitHub 上星标最多的 Node.js 最Backend Finanças:一个极简Node.js API,教你CRUD却难当大任devfraga/backend-financas仓库提供了一个面向个人财务应用的直白后端服务,基于Node.js和Express构建。它实现了经典的Model-View-Controller(MVC)模式,暴露了用于创建、读取、更新和删除React Native金融应用:Udemy课程项目的真实潜力与边界由开发者'andreokanabr'创建的'cursoreactnative'仓库,是一个跟随Udemy课程构建的学习项目。它演示了一款移动金融应用,前端使用React Native,Firebase负责认证和实时数据,SQLite用于本地查看来源专题页GitHub 已收录 1044 篇文章

时间归档

April 20262402 篇已发布文章

延伸阅读

Node.js 最佳实践:那个重塑生产级 JavaScript 的 10 万星 GitHub 指南拥有超过 105,000 个 GitHub 星标的 goldbergyoni/nodebestpractices 仓库,已成为 Node.js 开发领域最权威的社区驱动参考。AINews 深入剖析这份“活文档”如何重塑整个 JavaScriBackend Finanças:一个极简Node.js API,教你CRUD却难当大任开源项目backend-financas以干净、极简的Node.js和Express REST API切入个人财务管理领域。其MVC结构与CRUD示例对初学者友好,但缺乏认证、持久化存储和用户管理等关键环节,让人质疑其实际应用价值。React Native金融应用:Udemy课程项目的真实潜力与边界一个结合React Native、Firebase、SQLite和Styled Components的Udemy课程项目,为移动金融应用提供了实用但有限的模板。本文深入剖析其架构、现实适用性,以及它揭示了移动开发教育的哪些现状。Llama Stack Ops:Meta 为生产级 AI 基础设施绘制的蓝图Meta 正式发布 Llama Stack Ops,一个专为 Llama 模型在云原生环境中部署、监控与运维而设计的配置仓库。此举标志着 Meta 正战略性地降低从实验性 AI 到生产级基础设施的门槛,为大规模企业部署提供标准化参考架构。

常见问题

GitHub 热点“Free GPT-5 and Gemini 2.5 Pro via API: The CLI Proxy That Breaks the Paywall”主要讲了什么?

The open-source project 'router-for-me/cliproxyapi' has exploded onto the scene, amassing over 28,500 GitHub stars in a matter of days, with a daily growth rate of +3,445 stars. It…

这个 GitHub 项目在“how to install cliproxyapi locally”上为什么会引发关注?

cliproxyapi is a Python-based proxy server that acts as a translation layer between standard API protocols (OpenAI-compatible, Gemini-compatible, Claude-compatible) and the command-line interfaces of various AI models. T…

从“cliproxyapi vs direct API cost comparison”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 28576,近一日增长约为 3445,这说明它在开源社区具有较强讨论度和扩散能力。