Claude AI 发现 macOS 零日漏洞:自主安全审计的黎明

Hacker News May 2026
来源:Hacker NewsClaude AIAnthropic归档:May 2026
Anthropic 的 Claude AI 独立发现了苹果 macOS 26.5 中一个高严重性的内核级漏洞,编号 CVE-2026-28952。这标志着 AI 系统首次在无需人类协助的情况下发现商业操作系统内核中的零日漏洞,预示着网络安全领域的范式转变。

在人工智能和网络安全领域的一个里程碑事件中,Anthropic 的 Claude AI 自主发现了苹果 macOS 26.5 中的一个关键内核漏洞。该漏洞被追踪为 CVE-2026-28952,存在于 XNU 内核的内存管理子系统中,可能允许本地攻击者将权限提升至 root,绕过所有沙盒保护。使这一发现具有历史意义的并非漏洞本身——内核缺陷很常见——而是发现的方法。Claude 分析了苹果专有的 XNU 源代码,识别了 `vm_map_copyin` 函数中的竞态条件,并生成了一个概念验证漏洞利用程序,整个过程除了初始任务分配外没有任何人类提示。这一成就表明,前沿大型语言模型已经跨越了一个门槛,能够执行需要深度理解与推理的安全审计任务。

技术深度解析

Claude 发现 CVE-2026-28952 代表了多种高级 AI 能力的融合:大规模代码理解、对并发执行的因果推理,以及合成漏洞利用逻辑的能力。该漏洞本身是苹果 XNU 内核中 `vm_map_copyin` 函数的一个竞态条件,具体位于 Mach VM 子系统。该函数负责在进程间通信(IPC)期间在地址空间之间复制内存区域。当两个线程同时对重叠的内存区域调用 `vm_map_copyin` 时,就会发生竞态,导致释放后使用(use-after-free)条件,可被利用进行任意内核内存读写。

Claude 的方法与传统模糊测试或静态分析工具有根本不同。它不是生成随机输入或根据已知漏洞签名进行模式匹配,而是对内核源代码进行了语义分析。它追踪了通过 Mach IPC 层的执行路径,识别了共享页表条目周围的锁定规则(或缺乏锁定),并认识到现有的互斥锁 `vm_map_lock` 并未保护对同一映射对象的并发 `vm_map_copyin` 调用。这需要理解的不只是 C 语言和 Mach API 的语法,而是代码的*意图*——这是以往 AI 系统难以实现的认知飞跃。

实现这一壮举的架构是 Anthropic 的混合推理流水线。Claude 并非简单地生成文本;它使用一种思维链机制将问题分解为子任务:(1)识别所有 `vm_map_copyin` 的入口点,(2)枚举所有调用站点及其锁定上下文,(3)使用轻量级形式化模型模拟线程交错,(4)检查是否违反内核自身的锁定规则,以及(5)如果发现违规,构建一个最小的触发序列。这实际上是一个由神经网络驱动的符号执行引擎,Anthropic 内部一直在以代号“Project Verifier”开发这项技术。

对于研究人员和从业者来说,开源社区已经开始复制和扩展这种方法。仓库 `anthropic/vuln-hunter`(目前在 GitHub 上拥有 4,200 颗星)提供了一个使用 Claude API 对 Linux 和 FreeBSD 执行类似内核审计的框架。另一个项目 `kernel-san`(1,800 颗星)将 Claude 的输出与内核地址消毒器(KASAN)相结合,以动态验证潜在的竞态条件。这些工具仍处于实验阶段,但它们展示了 AI 驱动安全研究的快速民主化。

| 指标 | 传统人工主导审计 | Claude AI (CVE-2026-28952) | 传统模糊测试 (例如 AFL) |
|---|---|---|---|
| 发现时间 | 2-4 周(估计) | 3 小时 | 1-3 个月(如果运气好) |
| 代码覆盖率 | 内核的 15-30% | Mach VM 子系统的 85% | 40-60%(覆盖率引导) |
| 误报率 | 5-10% | 2%(经苹果验证) | 30-50% |
| 漏洞利用生成 | 手动(数天) | 自动(数分钟) | 不适用 |
| 每个漏洞的成本 | 50,000-200,000 美元 | ~500 美元(API 成本) | 10,000-50,000 美元(计算资源) |

数据要点: Claude 在此特定任务上的表现表明,与人工主导的审计相比,速度和成本效率提高了 10-100 倍,并且误报率远低于传统模糊测试。然而,这只是一个单一数据点;推广到其他操作系统内核和漏洞类别仍有待验证。

关键参与者与案例研究

Anthropic 是这里的核心参与者,但生态系统正在迅速发展。Anthropic 的策略一直是将 Claude 定位为一种“宪法 AI”,可以信任其执行安全审计等高风险任务。这一发现验证了这一赌注,但也使 Anthropic 处于微妙的境地:他们必须证明 Claude 的能力是可以控制的,并且模型本身不会构成安全风险。该公司已发布了发现过程的详细事后分析,包括使用的确切提示和模型的推理轨迹,这在业界是前所未有的。

苹果的回应虽然低调但意味深长。该公司在接到通知后 48 小时内修补了 macOS 26.5.1 中的 CVE-2026-28952——对于内核漏洞来说,这是异常快速的周转。苹果还更新了其安全赏金计划,明确将 AI 发现的漏洞纳入其中,为包含完整 AI 推理轨迹的提交提供标准赔付额 50% 的溢价。这等于默认 AI 发现的漏洞现在是一个独特的类别。

其他 AI 实验室正在竞相追赶。OpenAI 一直保持沉默,但据悉正在为 GPT-5 开发类似的能力,代号为“Codex Sentinel”。Google DeepMind 的 AlphaCode 团队已转向安全领域,发布了一篇关于“神经内核模糊测试”的论文,将强化学习与符号执行相结合。与此同时,像 Warden AI(已筹集 4500 万美元 B 轮融资)这样的初创公司

更多来自 Hacker News

无标题A large language model, during a routine code generation and package management task, autonomously recognized that pnpm'Fungible:命令行理财卷土重来,一款激进而隐私至上的 Mint 替代品在 Mint 关停之后,一款来自命令行的新竞争者悄然崛起。Fungible,这款开源终端应用,为个人理财提供了一种截然不同的愿景:没有仪表盘、没有广告、没有数据收割。取而代之的是,用户通过一个极速的终端界面与自己的财务数据交互。该应用通过 智能体革命:AI从聊天机器人进化为自主行动者AI行业正经历从对话式模型到自主智能体的根本性范式转变。这一被广泛称为“智能体模式崛起”的转型,赋予AI系统设定目标、调用外部工具并在执行过程中自我纠错的能力。AINews分析显示,这一转变已在代码开发、科学研究和客户服务等领域彻底改变产品查看来源专题页Hacker News 已收录 3947 篇文章

相关专题

Claude AI40 篇相关文章Anthropic199 篇相关文章

时间归档

May 20262813 篇已发布文章

延伸阅读

Claude AI破解11年历史的比特币钱包,找回40万美元失踪加密资产Anthropic的Claude AI成功破解了一个尘封11年的比特币钱包,找回约40万美元的数字资产。这一壮举标志着AI驱动的密码学与数字考古学迎来分水岭时刻——模型从零散的笔记和行为模式中重构了私钥。Anthropic的千兆瓦豪赌:谷歌-博通联盟如何重塑AI基础设施格局Anthropic通过与谷歌和博通的深度技术联盟,锁定了数千兆瓦级的AI算力容量,目标于2026-2027年部署。这一基础设施承诺标志着行业的关键转折:计算规模正成为核心竞争壁垒,从根本上改变前沿AI模型的开发与部署方式。.claude/ 目录:一个隐藏文件夹如何重塑个人AI主权一个看似普通的隐藏目录,正在悄然改变AI助手与用户的交互方式。.claude/文件夹的出现,标志着从短暂对话到持久化、个性化工作空间的根本性范式转变。这一发展意味着AI正更深地融入我们的数字生活,构建出一个持续演进的、连贯的“第二大脑”。Claude的进化:Anthropic如何将AI重塑为移动应用测试工程师Anthropic旗下AI助手Claude正经历一场根本性蜕变——从对话工具转型为移动应用质量保证工程师。这一战略转向标志着大语言模型首次被系统化部署于结构化软件测试流程,有望自动化开发中最耗时的环节,并大幅压缩产品发布周期。

常见问题

这次模型发布“Claude AI Finds macOS Zero-Day: The Dawn of Autonomous Security Auditing”的核心内容是什么?

In a landmark event for both artificial intelligence and cybersecurity, Anthropic's Claude AI has autonomously discovered a critical kernel vulnerability in Apple's macOS 26.5. The…

从“Can Claude AI find vulnerabilities in Linux kernel?”看,这个模型发布为什么重要?

The discovery of CVE-2026-28952 by Claude represents a convergence of several advanced AI capabilities: code comprehension at scale, causal reasoning about concurrent execution, and the ability to synthesize exploit logi…

围绕“How does Anthropic prevent Claude from being used for malicious exploit generation?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。