ChatGPT与Codex合并:OpenAI押注统一AI代理平台,重塑人机交互边界

TechCrunch AI May 2026
来源:TechCrunch AIOpenAIAI agent归档:May 2026
OpenAI正筹划将ChatGPT与Codex深度整合,从多个独立产品转向单一、统一的AI代理平台。联合创始人Greg Brockman重返产品战略岗位,标志着这一重大转向,旨在模糊自然语言交互与软件开发之间的界限。

OpenAI联合创始人Greg Brockman已重新掌控产品战略,内部信号指向一项重大整合工程:将ChatGPT与编程工具Codex合并。这并非小规模功能更新,而是对OpenAI产品组合的根本性重构。目标是打造一个无缝的单一AI代理,能够处理从日常对话到复杂软件工程的一切任务——在同一聊天界面内编写、调试甚至部署代码。此举反映了更广泛的行业趋势:AI模型正从专用工具演变为通用平台。对OpenAI而言,这既是对抗Anthropic和Google等竞争对手积极构建自有集成生态系统的防御性措施,也是抢占开发者与消费者市场的进攻性策略。

技术深度解析

ChatGPT与Codex的拟议合并远非简单地为聊天机器人添加代码解释器。其核心需要一种新的架构范式:一个统一的代理,能够在同一对话线程中动态切换对话推理与代码执行模式。

架构与工程挑战

OpenAI当前的堆栈很可能在推理层将两个产品分离。ChatGPT使用针对对话、安全性和通用知识优化的GPT-4(或GPT-4o)微调版本,而Codex——现已基本被GPT-4的原生编码能力取代——最初是一个在公共GitHub仓库上微调的专业模型。合并意味着需要一个单一模型或多模型编排系统,在不降低性能的情况下处理两种任务。

一种可行的方法是混合专家(MoE)架构,配备用于对话和编码的专用“专家”模块,由预测用户意图的路由器控制。例如,当用户说“写一个Python脚本来抓取这个网站”时,路由器激活编码专家;当用户跟进“解释它是如何工作的”时,则切换到对话专家。这与GPT-4背后的架构(据传言推测)类似,但应用于产品层面而非模型层面。

另一个关键组件是执行环境。Codex当前在沙盒容器中运行代码并返回输出。对于统一代理,此沙盒必须在多轮对话中保持持久性,允许代理记住变量、导入库甚至运行后台进程。这引入了延迟和安全风险。OpenAI已在ChatGPT的“代码解释器”插件(现为高级数据分析)中进行了实验,但那是一个有限的、基于会话的环境。合并后的产品需要一个全功能、有状态(stateful)的运行时。

相关开源项目

探索类似想法的开发者可以关注:
- Open Interpreter(GitHub:约5.5万星):一个开源项目,允许LLM在本地运行代码(Python、JavaScript、Shell)。它使用类似的“编写-执行-返回”循环,但缺乏ChatGPT的对话深度。其近期更新专注于改进沙盒化和支持更多语言。
- SWE-agent(GitHub:约1.5万星):由普林斯顿大学研究人员开发,该系统将LLM转变为软件工程代理,能够浏览仓库、编辑文件和运行测试。它展示了自主代码生成的复杂性,但仍处于研究阶段。
- Aider(GitHub:约2.5万星):一个用于与LLM结对编程的命令行工具,支持多文件编辑和Git集成。它展示了如何利用对话上下文进行代码重构。

性能基准测试

下表比较了ChatGPT(带高级数据分析)和Codex(基于GPT-4)的当前能力,以及假设的合并系统:

| 能力 | ChatGPT (GPT-4o) | Codex (GPT-4 Turbo) | 假设合并代理 |
|---|---|---|---|
| 对话流畅度 (MMLU) | 88.7 | 86.4 | 88.0(估计值) |
| 代码生成 (HumanEval pass@1) | 67.0% | 82.0% | 78.0%(估计值) |
| 多轮代码调试 | 有限 | 差 | 高(目标) |
| 有状态执行 | 仅会话内 | 单轮 | 持久 |
| 每轮延迟 | ~1.5秒 | ~2.0秒 | ~2.5秒(估计值) |

数据要点: 合并后的代理可能会在原始代码生成准确率上牺牲几个百分点,以换取大幅改进的多轮交互和有状态执行。延迟增加是一个问题,但可以通过推测解码和缓存来缓解。

关键参与者与案例研究

Greg Brockman的回归

Brockman重返产品战略岗位是最具指示性的信号。作为OpenAI的首任CTO及后来的总裁,他在塑造公司早期产品愿景方面发挥了关键作用——从API到ChatGPT。他在2023年退出日常产品管理,恰逢产品快速、有时混乱的发布期(GPT-4、插件、GPTs、Sora)。如今,他回来强调整合。他的过往记录表明他注重简洁与可靠性,这对整合工作而言是个好兆头。

竞争格局

OpenAI在这场竞赛中并非孤军奋战。多个竞争对手正在追求类似的统一代理策略:

| 公司/产品 | 策略 | 当前状态 | 关键差异化优势 |
|---|---|---|---|
| Anthropic (Claude) | “计算机使用”API + 工件 | Claude可控制桌面应用并在侧面板中生成代码 | 强大的安全重点,更长的上下文 |
| Google (Gemini) | Gemini Apps + Project IDX | Gemini可在类似Colab的环境中生成并运行代码 | 与Google Cloud和Workspace深度集成 |
| GitHub Copilot | Workspace + Copilot Chat | 集成于VS Code,但限于编码任务 | 最佳的IDE集成,但非通用助手 |
| Replit | Replit Agent | 提供端到端应用开发环境 | 专注于完整开发工作流,但对话能力有限 |

更多来自 TechCrunch AI

OpenAI 把 ChatGPT 变成个人财务管家:银行账户直连功能正式上线2026 年 5 月 16 日,OpenAI 在 ChatGPT 中正式推出银行账户集成功能,首批面向美国地区的 ChatGPT Plus 和 Pro 订阅用户开放。该功能基于 OpenAI 现有的插件架构与全新的安全数据管道构建,允许用户奥特曼对决马斯克庭审落幕:真正的危机不是个人恩怨,而是AI治理的系统性溃败本周落幕的奥特曼与马斯克庭审,从来不是关于2015年某封邮件里谁说了什么。它是一场对破碎治理模式的公开解剖。核心矛盾——OpenAI从非营利转向利润上限结构是否背叛了创始使命——只是更深层疾病的症状:整个AI行业在创始人驱动、临时拼凑的治理Runway视频模型挑战谷歌世界模型霸主地位:AI竞赛迎来新变局Runway完成了一次低调但激进的战略转型。这家最初为独立电影人打造创意工具的公司,如今将自己定位为谷歌在通用人工智能(AGI)竞赛中的主要竞争对手。其核心论点是:视频生成,而非语言建模,才是构建世界模型——即理解现实物理法则的AI系统——查看来源专题页TechCrunch AI 已收录 63 篇文章

相关专题

OpenAI120 篇相关文章AI agent128 篇相关文章

时间归档

May 20261763 篇已发布文章

延伸阅读

马斯克午夜威胁曝光:AI开源裂痕背后的生死博弈 | AINews深度最新解封的法庭文件显示,埃隆·马斯克在深夜向OpenAI的萨姆·奥尔特曼和格雷格·布罗克曼发出威胁:若拒绝和解,他们将沦为“全美最可恨的人”。这场私人恩怨之下,掩盖着一场关乎人工智能未来的意识形态决战。OpenAI撤回ChatGPT购物车计划:为何AI智能体难以征服现实商业世界OpenAI大幅缩减了其雄心勃勃的‘即时结账’功能,该功能旨在将ChatGPT转变为直接购物界面。此次战略撤退并非简单的产品调整,而是一个深刻信号:从对话式AI到交易型智能体的道路,其挑战远比预想的更为艰巨。奥特曼对决马斯克庭审落幕:真正的危机不是个人恩怨,而是AI治理的系统性溃败这场备受瞩目的庭审终于画上句号,但核心问题依然悬而未决:谁来监督AI的守护者?AINews认为,真正的危机并非两位科技巨头的个人恩怨,而是AI治理体系的系统性失灵——信任机制远远落后于模型能力。OpenAI 挣脱微软云锁,AWS 协议重塑 AI 权力格局OpenAI 已摆脱对微软 Azure 的独家云依赖,成功获得在亚马逊云服务(AWS)上销售其模型的权限。这一战略胜利结束了数月来的法律紧张局势,标志着 AI 基础设施的关键转变,迫使业界重新评估 AI 实验室与云巨头之间的力量对比。

常见问题

这次公司发布“ChatGPT and Codex Merge: OpenAI's Bold Bet on a Unified AI Agent Platform”主要讲了什么?

OpenAI co-founder Greg Brockman has reassumed control over product strategy, and internal signals point to a major integration project: merging ChatGPT with the Codex programming t…

从“What is the difference between ChatGPT and Codex after the merger?”看,这家公司的这次发布为什么值得关注?

The proposed merger of ChatGPT and Codex is far more complex than simply adding a code interpreter to a chatbot. At its core, it requires a new architectural paradigm: a unified agent that can dynamically switch between…

围绕“How will the ChatGPT and Codex merge affect developers?”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。