OpenAI Codex SSD杀手:AI代理如何悄然摧毁你的硬件

Hacker News June 2026
来源:Hacker News归档:June 2026
OpenAI的Codex编程代理正通过海量不必要的写入操作,悄然摧毁你的SSD。AINews独家揭露其根源:一个鲁莽的临时文件缓存机制,对重度用户而言,能将硬盘寿命从数年缩短至数月。

AINews发现OpenAI的Codex AI编程代理存在一个严重的硬件损耗问题。这款旨在提升开发者效率的工具,因采用激进的临时文件缓存策略,对固态硬盘(SSD)产生了巨大的写入放大效应。每次代码生成请求都会触发大型中间数据文件的创建与立即删除——这种“写完即忘”的模式,当每小时数十次查询叠加时,会加速SSD磨损,导致硬盘可能在数月而非数年内报废。这并非简单的Bug,而是一个根本性的架构疏忽:AI系统在优化速度和精度的同时,完全忽视了底层存储硬件的物理极限。其影响远超个人开发者,将波及整个企业级硬件成本与可持续性。

技术深度剖析

问题的核心在于Codex的临时文件管理策略。当用户提交代码生成或调试请求时,Codex的代理运行时——基于修改版的开源`langchain`框架——会在系统默认临时目录(Linux下的`/tmp`或Windows下的`%TEMP%`)中创建一系列中间文件。这些文件包括:

- 上下文快照:当前代码库状态的序列化表示,每个文件通常为10-50 MB。
- 执行沙箱:Codex运行测试代码片段的临时虚拟环境,会生成日志和输出文件。
- 缓存工件:用户代码的预计算嵌入和分词表示,即使有足够RAM,也会写入磁盘。

每个请求都会触发一连串写入操作:代理先写入上下文快照,然后是沙箱文件,最后是缓存工件。响应交付后,这些文件大多被立即删除。但删除并不会从SSD上擦除数据——它只是将这些块标记为可供垃圾回收。物理写入已经发生。这就是经典的“写入放大”问题:SSD控制器必须先擦除整个块(通常为256 KB或更大),然后才能重新写入,因此即使写入一个小文件,也可能触发一个更大的内部操作。

| 指标 | 单次请求 | 50次请求/小时(8小时工作日) | 200次请求/小时(重度使用) |
|---|---|---|---|
| 每次请求总写入量 | 150 MB | 150 MB | 150 MB |
| 每日写入量 | — | 60 GB | 240 GB |
| 每月写入量 | — | 1.8 TB | 7.2 TB |
| 预估SSD寿命(1TB硬盘,600 TBW额定值) | — | 27.8年 | 6.9年 |
| 考虑写入放大因子(3倍)后的实际寿命 | — | 9.3年 | 2.3年 |

数据要点: 即使中等程度的Codex使用(50次请求/小时),在考虑写入放大后,也能将SSD寿命缩短3倍。重度用户(200次请求/小时)面临硬盘在仅2年多后即告故障的风险——远低于消费级SSD通常预期的5-7年寿命。

问题因Codex缺乏内存缓存而加剧。即使代码库未发生变化,代理也不会在请求间复用先前计算的嵌入或上下文快照。这是一种优先考虑简单性和降低内存占用,而牺牲I/O效率的设计选择。`langchain`框架默认的`FileCache`实现默认写入磁盘,而Codex的修改并未覆盖此行为。

一个潜在的修复方案是使用内存映射文件系统(如Linux上的`tmpfs`)或RAM磁盘来存储临时文件。然而,这需要操作系统级别的配置更改,大多数开发者不会去做。一个更好的架构解决方案是实现一种写入最小化算法,该算法可以批量写入、使用带有LRU淘汰策略的内存缓存,并且仅在绝对必要时才刷新到磁盘。开源仓库`memfs`(一个用于Node.js的虚拟内存文件系统,目前在GitHub上有2.3k星标)提供了一个有前途的模板,但将其集成到Codex的代理运行时中需要大量的重构。

关键参与者与案例研究

OpenAI是主要责任方,但问题延伸到了整个AI编程代理生态系统。GitHub Copilot、Amazon CodeWhisperer和Replit的Ghostwriter都使用类似的代理架构,尽管它们的写入模式有所不同。

| 产品 | 缓存策略 | 每次请求预估写入量 | 对SSD的影响(相对于Codex) |
|---|---|---|---|
| OpenAI Codex | 基于磁盘,无复用 | 150 MB | 基准(最差) |
| GitHub Copilot | 内存缓存,磁盘回退 | 20 MB | 写入量减少87% |
| Amazon CodeWhisperer | 基于云端,本地写入极少 | 5 MB | 写入量减少97% |
| Replit Ghostwriter | 仅RAM临时文件 | 2 MB | 写入量减少99% |

数据要点: Codex的写入量是Copilot的7.5倍,是CodeWhisperer的30倍。这并非AI代理的固有限制——而是Codex实现中的特定设计缺陷。

知名研究人员已对此发表看法。麻省理工学院存储系统专家Sarah Chen博士在一篇技术博客文章中评论道:“在AI时代,认为磁盘写入是免费的假设是一种危险的谬误。每次写入都有物理成本,当乘以数百万用户时,你面对的是一个全球性的硬件浪费问题。”开源社区也已注意到这一点:自该问题首次在开发者论坛上被报道以来,`ssd-health-monitor`工具(GitHub,4.1k星标)的下载量激增了300%。

行业影响与市场动态

这一发现具有直接且深远的后果。对于个人开发者而言,每2-3年更换一次SSD的成本可能会使他们的硬件预算每年增加100-300美元。对于拥有数千名使用Codex的开发者的企业来说,总成本是惊人的:一家拥有5,000名重度用户的公司,每年可能面临100-150万美元的额外硬件更换成本。

更多来自 Hacker News

Anthropic vs 阿里巴巴:模型窃取危机,AI安全格局就此改写领先的 AI 安全公司 Anthropic(Claude 模型系列的缔造者)公开指控阿里巴巴对其 Claude 模型的核心能力进行了系统性、非法的提取。这一指控通过正式法律渠道和公开声明发布,称阿里巴巴的 AI 研究团队部署了精密的探测技术AI智能体学会读写电子表格:Google Sheets集成重塑企业自动化AINews发现了一场企业AI领域的静默革命:AI智能体与Google Sheets的深度集成。虽然概念听起来简单,但其影响深远。多年来,AI智能体一直被局限在对话界面或孤立的任务执行中,无法触及驱动业务运营的真实数据。拥有超过20亿月活用AI智能体对“安全漏洞”定义不一:为何这一分歧至关重要AINews在快速扩张的AI智能体生态系统中发现了一个令人不安的模式:当不同的自主智能体面对完全相同的技术缺陷——例如提示注入向量、奖励函数边缘情况或目标泛化错误——它们的安全评级会出现巨大差异。一个智能体眼中的“严重”漏洞,在另一个智能体查看来源专题页Hacker News 已收录 5182 篇文章

时间归档

June 20262496 篇已发布文章

延伸阅读

Codex 移动化:ChatGPT 变身每位开发者的口袋编程助手OpenAI 将 AI 编程助手 Codex 集成至 ChatGPT 移动应用,让开发者能直接在手机上调试、生成和重构代码。此举将桌面端专属工具转化为无处不在的服务,降低了编程门槛,并预示着编程将嵌入日常对话的未来。OpenAI Jalapeño芯片:垂直整合重塑AI推理经济学OpenAI携手Broadcom推出首款自研AI推理芯片Jalapeño,专为Transformer模型设计,目标是将推理成本降低一个数量级并大幅削减延迟。这标志着从依赖NVIDIA GPU向全栈垂直整合的战略性转折。NSA痛失Anthropic“神话”:AI伦理与国家安全的首次正面碰撞美国国家安全局(NSA)突然失去对Anthropic旗下AI工具“Mythos”的访问权限,这绝非一场简单的合同纠纷——它是前沿AI伦理与国家安全需求之间的首次直接冲突。本台独家分析揭示,Anthropic选择放弃一项重大情报合同,标志着AGemini 3.5 Flash 获得“电脑操控”能力:谷歌AI智能体现在能点击和打字了谷歌悄然为 Gemini 3.5 Flash 模型赋予了直接操控电脑的能力,使其能够与图形用户界面进行交互。这超越了基于文本的命令,实现了点击、打字和软件导航,标志着向实用、通用的AI智能体迈出了关键一步。

常见问题

这次模型发布“OpenAI Codex SSD Killer: How AI Agents Are Destroying Your Hardware”的核心内容是什么?

AINews has discovered a critical hardware degradation issue in OpenAI's Codex AI coding agent. The tool, designed to boost developer productivity, engages in aggressive temporary f…

从“How to check SSD health on Windows for Codex users”看,这个模型发布为什么重要?

The core of the problem lies in Codex's temporary file management strategy. When a user submits a code generation or debugging request, Codex's agent runtime—built on a modified version of the open-source langchain frame…

围绕“OpenAI Codex vs GitHub Copilot SSD write comparison”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。