OpenAI 狩猎开源漏洞:AI 加固代码安全生态

TechCrunch AI June 2026
来源:TechCrunch AIOpenAI归档:June 2026
OpenAI 启动了一项全新计划,旨在自动检测并修复开源软件中的安全漏洞。此举标志着这家 AI 巨头从追逐前沿模型转向主动加固数字公共基础设施,构建了一个 AI 清理自身训练代码的共生闭环。

OpenAI 的新开源漏洞狩猎计划,代表着其从纯粹模型进步到主动代码生态系统管理的战略转向。该计划利用大型语言模型的深度语义理解能力,识别传统静态分析工具经常遗漏的逻辑级漏洞——例如权限提升路径和数据泄露路线。它建立了一个闭环工作流:AI 发现缺陷,生成候选修复方案,并以拉取请求的形式提交给人类维护者审查。这极大地减轻了不堪重负的开源维护者的安全审计负担,同时保留了人类的最终决定权。除了直接的安全收益,该计划也服务于 OpenAI 的自身利益:该公司的模型大量训练于开源代码,因此清理这些代码能提升训练数据质量,减少模型学习到不安全模式的风险。从更广的视角看,这是 AI 从“消费”开源资源到“回馈”开源社区的关键一步,可能重塑整个软件供应链的安全格局。

技术深度解析

OpenAI 的漏洞狩猎计划建立在远超传统静态应用安全测试(SAST)的先进代码理解能力之上。像 SonarQube 或 Checkmarx 这类传统工具依赖对已知漏洞特征的模式匹配(例如,针对 SQL 注入模式的正则表达式)和抽象语法树分析。它们擅长检测语法问题——未初始化变量、缓冲区溢出或硬编码凭据——但当漏洞嵌入复杂的控制流或需要多步骤推理时,它们就会失效。

大型语言模型,尤其是 GPT-4 级别,将代码视为语义产物。它们从数十亿行代码中学习程序行为的表示,从而能够跨函数边界追踪数据流、识别隐式信任边界,并推理特定 API 调用的后果。例如,模型可以检测到用户提供的参数未经清理就流入文件路径,然后进入执行系统命令的函数——如果这些调用被多层抽象隔开,传统扫描器就会错过这条路径。

技术架构可能涉及一个经过微调的 GPT-4 变体(或专门的代码模型),该模型已进一步在漏洞数据集上训练,例如 CVE 描述、修复安全问题的提交信息以及不安全代码模式的合成示例。模型通过分析易受攻击的函数、周围上下文以及从文档或类似代码模式推断出的预期行为,生成候选补丁。然后,该补丁会针对测试套件(如果可用)进行验证,并格式化为带有清晰解释的拉取请求。

一个关键的工程挑战是减少误报。在早期测试中,基于 LLM 的漏洞检测器可能因过度泛化而将良性代码标记为恶意代码。OpenAI 可能采用两阶段流水线:一个高召回率的模型进行广泛撒网,随后一个高精度的模型过滤掉不太可能的漏洞。最终输出按严重性和置信度排序。

| 工具 | 检测方法 | 漏洞类型 | 误报率 | 上下文理解 |
|---|---|---|---|---|
| 传统 SAST(例如 SonarQube) | 模式匹配,AST 分析 | 语法错误,注入,缓冲区溢出 | 20-30% | 低(单个文件) |
| OpenAI Bug Hunt | LLM 语义分析 | 逻辑缺陷,权限提升,数据泄露 | 10-15%(估计) | 高(跨函数,跨文件) |
| 模糊测试(例如 AFL) | 随机输入生成 | 内存损坏,崩溃 | <5% | 无(仅运行时) |

数据要点: OpenAI 的方法以略高于模糊测试的误报率,换取了显著更广的漏洞覆盖范围,尤其是模糊测试无法触及的逻辑错误。如果模型能提供清晰的解释帮助维护者快速分类,10-15% 的误报率是可以接受的。

一个值得关注的相关开源项目是 CodeQL(GitHub,7000+ 星标),它使用声明式查询语言来查找漏洞。CodeQL 功能强大,但需要专家编写查询。OpenAI 的模型旨在通过自动生成查询或补丁来降低这一门槛。另一个是 Semgrep(GitHub,10000+ 星标),一个支持自定义规则的轻量级静态分析工具。LLM 方法最终可以从自然语言描述生成 Semgrep 规则,弥合人类意图与机器检测之间的鸿沟。

关键参与者与案例研究

这一计划使 OpenAI 与既有的安全公司和新兴的 AI 原生初创公司直接竞争。关键参与者分为三类:

现有安全供应商: 像 Snyk、Checkmarx 和 Veracode 这样的公司已经构建了数十年的 SAST 和软件组成分析(SCA)产品。例如,Snyk 已融资超过 8 亿美元,服务于 2000 多家企业客户。他们的优势在于与 CI/CD 管道的深度集成和合规报告。然而,他们的检测引擎基于规则,难以应对新颖的漏洞模式。OpenAI 的模型无需手动更新规则即可适应新的攻击向量。

AI 原生初创公司: 新一波公司正在将 LLM 应用于代码安全。Socket(YC 孵化)专注于通过分析包行为来防范供应链攻击。Mobb(已融资 1000 万美元)使用 AI 自动修复漏洞。CodeRabbit 提供 AI 驱动的代码审查。这些初创公司灵活敏捷,但缺乏 OpenAI 的规模、计算资源和品牌信任。OpenAI 的进入可能会使其核心价值主张商品化。

开源维护者: 最终的受益者是像 Linux 内核(超过 2000 万行代码,数千名贡献者)、Node.js 运行时和 Python 生态系统这样的项目。开源安全基金会(OpenSSF)估计,90% 的关键开源项目存在未修补的漏洞。维护者已经不堪重负,OpenAI 的工具可以显著减轻他们的安全审计负担,让他们专注于功能开发和社区管理。

更多来自 TechCrunch AI

无限循环革命:AI智能体如何通过永续迭代重塑自主决策AI智能体领域正经历一场根本性变革。过去的主流范式——智能体接收提示、执行任务、然后停止——正被一种全新模型「Loopy」架构所取代。在这一框架中,多个专业智能体在一个持续、自我强化的循环中运行。每个智能体的输出被反馈回系统作为输入,形成永英伟达节水冷却方案,治标不治本:AI真正的“水龙头”在发电厂英伟达近日宣布为其数据中心GPU推出新一代冷却系统,旨在大幅减少现场用水。该系统采用闭环液冷和先进干冷技术,与传统蒸发冷却塔相比,可将直接用水量削减高达90%。这是一项值得称赞的工程成就——它减少了服务器机架散热所需的水量,降低了运营成本,Groq战略转身:从芯片制造商到AI推理云,重塑计算格局Groq,这家曾被视为英伟达在AI芯片领域挑战者的公司,近日宣布完成6.5亿美元融资,并彻底转型其商业模式。公司现以“NeoCloud”品牌定位为AI推理即服务平台,从销售硬件转向提供基于云的自研语言处理单元(LPU)访问。这一战略转变发生查看来源专题页TechCrunch AI 已收录 89 篇文章

相关专题

OpenAI163 篇相关文章

时间归档

June 20262246 篇已发布文章

延伸阅读

特朗普监管重锤砸向Anthropic:AI权力洗牌,谁才是真正赢家?特朗普政府对Anthropic的监管打压并非孤立事件,而是美国AI治理的根本性转向。AINews独家分析揭示隐藏赢家——OpenAI、开源社区与中国AI玩家,并警告:安全优先的路线正为政治权宜之计而牺牲。ChatGPT与Codex合并:OpenAI押注统一AI代理平台,重塑人机交互边界OpenAI正筹划将ChatGPT与Codex深度整合,从多个独立产品转向单一、统一的AI代理平台。联合创始人Greg Brockman重返产品战略岗位,标志着这一重大转向,旨在模糊自然语言交互与软件开发之间的界限。奥特曼对决马斯克庭审落幕:真正的危机不是个人恩怨,而是AI治理的系统性溃败这场备受瞩目的庭审终于画上句号,但核心问题依然悬而未决:谁来监督AI的守护者?AINews认为,真正的危机并非两位科技巨头的个人恩怨,而是AI治理体系的系统性失灵——信任机制远远落后于模型能力。马斯克午夜威胁曝光:AI开源裂痕背后的生死博弈 | AINews深度最新解封的法庭文件显示,埃隆·马斯克在深夜向OpenAI的萨姆·奥尔特曼和格雷格·布罗克曼发出威胁:若拒绝和解,他们将沦为“全美最可恨的人”。这场私人恩怨之下,掩盖着一场关乎人工智能未来的意识形态决战。

常见问题

这次模型发布“OpenAI Hunts Open Source Bugs: AI Fortifies Code Security Ecosystem”的核心内容是什么?

OpenAI's new open source bug hunting program represents a strategic pivot from pure model advancement to proactive code ecosystem stewardship. The initiative leverages large langua…

从“How does OpenAI's bug hunting compare to traditional SAST tools like SonarQube?”看,这个模型发布为什么重要?

OpenAI's bug hunting program is built on a foundation of advanced code understanding capabilities that go far beyond traditional static application security testing (SAST). Conventional tools like SonarQube or Checkmarx…

围绕“Can OpenAI's auto-generated patches introduce new security vulnerabilities?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。