ChatGPT与Codex合并:OpenAI押注统一AI代理平台,重塑人机交互边界

TechCrunch AI May 2026
来源:TechCrunch AIOpenAICodexAI agent归档:May 2026
OpenAI正筹划将ChatGPT与Codex深度整合,从多个独立产品转向单一、统一的AI代理平台。联合创始人Greg Brockman重返产品战略岗位,标志着这一重大转向,旨在模糊自然语言交互与软件开发之间的界限。

OpenAI联合创始人Greg Brockman已重新掌控产品战略,内部信号指向一项重大整合工程:将ChatGPT与编程工具Codex合并。这并非小规模功能更新,而是对OpenAI产品组合的根本性重构。目标是打造一个无缝的单一AI代理,能够处理从日常对话到复杂软件工程的一切任务——在同一聊天界面内编写、调试甚至部署代码。此举反映了更广泛的行业趋势:AI模型正从专用工具演变为通用平台。对OpenAI而言,这既是对抗Anthropic和Google等竞争对手积极构建自有集成生态系统的防御性措施,也是抢占开发者与消费者市场的进攻性策略。

技术深度解析

ChatGPT与Codex的拟议合并远非简单地为聊天机器人添加代码解释器。其核心需要一种新的架构范式:一个统一的代理,能够在同一对话线程中动态切换对话推理与代码执行模式。

架构与工程挑战

OpenAI当前的堆栈很可能在推理层将两个产品分离。ChatGPT使用针对对话、安全性和通用知识优化的GPT-4(或GPT-4o)微调版本,而Codex——现已基本被GPT-4的原生编码能力取代——最初是一个在公共GitHub仓库上微调的专业模型。合并意味着需要一个单一模型或多模型编排系统,在不降低性能的情况下处理两种任务。

一种可行的方法是混合专家(MoE)架构,配备用于对话和编码的专用“专家”模块,由预测用户意图的路由器控制。例如,当用户说“写一个Python脚本来抓取这个网站”时,路由器激活编码专家;当用户跟进“解释它是如何工作的”时,则切换到对话专家。这与GPT-4背后的架构(据传言推测)类似,但应用于产品层面而非模型层面。

另一个关键组件是执行环境。Codex当前在沙盒容器中运行代码并返回输出。对于统一代理,此沙盒必须在多轮对话中保持持久性,允许代理记住变量、导入库甚至运行后台进程。这引入了延迟和安全风险。OpenAI已在ChatGPT的“代码解释器”插件(现为高级数据分析)中进行了实验,但那是一个有限的、基于会话的环境。合并后的产品需要一个全功能、有状态(stateful)的运行时。

相关开源项目

探索类似想法的开发者可以关注:
- Open Interpreter(GitHub:约5.5万星):一个开源项目,允许LLM在本地运行代码(Python、JavaScript、Shell)。它使用类似的“编写-执行-返回”循环,但缺乏ChatGPT的对话深度。其近期更新专注于改进沙盒化和支持更多语言。
- SWE-agent(GitHub:约1.5万星):由普林斯顿大学研究人员开发,该系统将LLM转变为软件工程代理,能够浏览仓库、编辑文件和运行测试。它展示了自主代码生成的复杂性,但仍处于研究阶段。
- Aider(GitHub:约2.5万星):一个用于与LLM结对编程的命令行工具,支持多文件编辑和Git集成。它展示了如何利用对话上下文进行代码重构。

性能基准测试

下表比较了ChatGPT(带高级数据分析)和Codex(基于GPT-4)的当前能力,以及假设的合并系统:

| 能力 | ChatGPT (GPT-4o) | Codex (GPT-4 Turbo) | 假设合并代理 |
|---|---|---|---|
| 对话流畅度 (MMLU) | 88.7 | 86.4 | 88.0(估计值) |
| 代码生成 (HumanEval pass@1) | 67.0% | 82.0% | 78.0%(估计值) |
| 多轮代码调试 | 有限 | 差 | 高(目标) |
| 有状态执行 | 仅会话内 | 单轮 | 持久 |
| 每轮延迟 | ~1.5秒 | ~2.0秒 | ~2.5秒(估计值) |

数据要点: 合并后的代理可能会在原始代码生成准确率上牺牲几个百分点,以换取大幅改进的多轮交互和有状态执行。延迟增加是一个问题,但可以通过推测解码和缓存来缓解。

关键参与者与案例研究

Greg Brockman的回归

Brockman重返产品战略岗位是最具指示性的信号。作为OpenAI的首任CTO及后来的总裁,他在塑造公司早期产品愿景方面发挥了关键作用——从API到ChatGPT。他在2023年退出日常产品管理,恰逢产品快速、有时混乱的发布期(GPT-4、插件、GPTs、Sora)。如今,他回来强调整合。他的过往记录表明他注重简洁与可靠性,这对整合工作而言是个好兆头。

竞争格局

OpenAI在这场竞赛中并非孤军奋战。多个竞争对手正在追求类似的统一代理策略:

| 公司/产品 | 策略 | 当前状态 | 关键差异化优势 |
|---|---|---|---|
| Anthropic (Claude) | “计算机使用”API + 工件 | Claude可控制桌面应用并在侧面板中生成代码 | 强大的安全重点,更长的上下文 |
| Google (Gemini) | Gemini Apps + Project IDX | Gemini可在类似Colab的环境中生成并运行代码 | 与Google Cloud和Workspace深度集成 |
| GitHub Copilot | Workspace + Copilot Chat | 集成于VS Code,但限于编码任务 | 最佳的IDE集成,但非通用助手 |
| Replit | Replit Agent | 提供端到端应用开发环境 | 专注于完整开发工作流,但对话能力有限 |

更多来自 TechCrunch AI

美光能否成为下一个英伟达?华尔街押注AI内存之王长期以来,AI硬件的叙事一直由英伟达的GPU霸主地位主导,但一场更安静的变革正在内存领域酝酿。曾被视作大宗商品内存制造商的美光科技,如今因其在高带宽内存(HBM)领域的领先地位,被分析师誉为潜在的“下一个英伟达”。这一转变源于AI工作负载的Mythos 5获超100家美国机构授权:主权AI基础设施的新纪元特朗普政府已正式授权超过100家美国公司和联邦机构部署Anthropic的Mythos 5模型,标志着从AI实验向系统性基础设施部署的决定性转变。关键的是,该授权扩展至这些组织内的非美国员工,表明Anthropic的“宪法AI”框架已成功应当最健康的创始人罹患癌症:他的AI成了私人医生38岁的创始人Connor Christu多年来 meticulously 追踪自己的生物标志物、睡眠和营养状况,却收到了II期胰腺癌的诊断。拒绝扮演纯粹被动的患者角色,他整理了一份完整的数字档案——涵盖三年超过15,000个数据点——并将查看来源专题页TechCrunch AI 已收录 97 篇文章

相关专题

OpenAI188 篇相关文章Codex36 篇相关文章AI agent252 篇相关文章

时间归档

May 20263028 篇已发布文章

延伸阅读

马斯克午夜威胁曝光:AI开源裂痕背后的生死博弈 | AINews深度最新解封的法庭文件显示,埃隆·马斯克在深夜向OpenAI的萨姆·奥尔特曼和格雷格·布罗克曼发出威胁:若拒绝和解,他们将沦为“全美最可恨的人”。这场私人恩怨之下,掩盖着一场关乎人工智能未来的意识形态决战。OpenAI撤回ChatGPT购物车计划:为何AI智能体难以征服现实商业世界OpenAI大幅缩减了其雄心勃勃的‘即时结账’功能,该功能旨在将ChatGPT转变为直接购物界面。此次战略撤退并非简单的产品调整,而是一个深刻信号:从对话式AI到交易型智能体的道路,其挑战远比预想的更为艰巨。Codex取代ChatGPT成为OpenAI旗舰产品:AI智能体团队时代来临OpenAI正式将Codex推上旗舰宝座,取代ChatGPT,推出多智能体自主协作完成复杂工作流的全新系统。这标志着从对话式AI向分布式AI劳动力体系的根本性转变。OpenAI 狩猎开源漏洞:AI 加固代码安全生态OpenAI 启动了一项全新计划,旨在自动检测并修复开源软件中的安全漏洞。此举标志着这家 AI 巨头从追逐前沿模型转向主动加固数字公共基础设施,构建了一个 AI 清理自身训练代码的共生闭环。

常见问题

这次公司发布“ChatGPT and Codex Merge: OpenAI's Bold Bet on a Unified AI Agent Platform”主要讲了什么?

OpenAI co-founder Greg Brockman has reassumed control over product strategy, and internal signals point to a major integration project: merging ChatGPT with the Codex programming t…

从“What is the difference between ChatGPT and Codex after the merger?”看,这家公司的这次发布为什么值得关注?

The proposed merger of ChatGPT and Codex is far more complex than simply adding a code interpreter to a chatbot. At its core, it requires a new architectural paradigm: a unified agent that can dynamically switch between…

围绕“How will the ChatGPT and Codex merge affect developers?”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。