Claude Mythos 接管15国：AI 首次直接操控关键基础设施

2026年6月5日 11:12 AINews Hacker News June 2026

来源：Hacker News Anthropic AI governance 归档：June 2026

Anthropic 已将 Claude Mythos 系统部署至15个国家，直接管理电网、水处理和交通等关键基础设施。这不是实验，而是大语言模型首次被授予自主、多步骤决策权，掌控数百万民众每日依赖的系统。

Anthropic 的 Claude Mythos 已从受控试验转向15个国家的实时运营，直接控制电力分配、水净化及交通管理等基本服务。这一部署标志着根本性转变：AI 不再是推荐引擎，而是自主操作者。其技术核心是一种新颖的“护栏级联”架构，通过多层故障安全机制，使系统在出现异常时无需人工干预即可优雅降级。关键在于，Claude Mythos 已基于数十年的工业 SCADA 日志进行重新训练，使其能够与早于现代互联网标准的遗留协议交互。商业上，Anthropic 正开创“可靠性即服务”模式，向政府客户销售保证的正常运行时间。

技术深度解析

Claude Mythos 并非改良版聊天机器人，而是专为零容忍环境设计的 AI 智能体。系统架构围绕三大核心创新：

1. 护栏级联架构

传统 AI 安全系统使用单一护栏——若模型输出危险指令，过滤器会将其拦截。Claude Mythos 采用多层级联：
- 第0层（输入验证）： 所有传感器数据和操作员指令均需通过基于物理的模拟器检查，该模拟器运行基础设施的数字孪生。任何违反物理定律的输入（例如，要求变压器负载增加500%）在到达模型前即被拒绝。
- 第1层（模型级约束）： LLM 本身通过基于电网运营商5万+事故报告语料的强化学习（RLHF）进行微调。它学会避免那些曾导致停电或污染的操作。
- 第2层（执行护栏）： 每个输出指令均通过确定性验证器，对照硬编码的安全边界（如电压限制、化学品剂量上限）进行检查。若指令超出边界，系统自动升级至人工操作员。
- 第3层（优雅降级）： 若模型无法在200毫秒内生成有效指令，系统将回退至预先批准的稳定状态——通常维持当前设置或缓慢降级操作。这避免了早期 AI 控制系统常见的“脆弱性故障”。

2. 遗留协议适配

大多数关键基础设施仍运行于 SCADA（监控与数据采集）协议，如 DNP3 和 IEC 60870-5-101，这些协议设计于20世纪80年代，缺乏原生加密并使用固定长度二进制帧。Anthropic 基于来自合作公用事业公司的15年 SCADA 日志定制数据集训练 Claude Mythos，总计超过2 PB 的时间序列数据。模型学会了解析这些二进制流并以正确格式发出指令。这是一项重大工程成就——此前没有 LLM 接受过直接控制工业控制系统的训练。

3. 多步骤自主决策

与早期需要人工批准每个操作的 AI 智能体不同，Claude Mythos 可执行多达12个步骤的序列而无需干预。例如，在水处理厂，系统可以：(1) 检测 pH 值下降，(2) 计算所需化学品剂量，(3) 打开阀门3.7秒，(4) 等待30秒，(5) 重新采样 pH 值，(6) 必要时调整剂量。每一步均被记录并可审计，形成可事后审查的决策链。

性能基准

| 指标 | Claude Mythos | GPT-4o（带安全过滤器） | 人工操作员（平均） |
|---|---|---|---|
| 决策延迟（关键警报） | 180ms | 1.2s | 4.5s |
| 误报率（不必要停机） | 0.02% | 0.15% | 0.10% |
| 漏报率（错过危险） | 0.001% | 0.05% | 0.03% |
| 正常运行时间（过去6个月） | 99.9997% | 不适用（未部署） | 99.98% |

数据要点： Claude Mythos 在延迟和漏报率上均优于 GPT-4o 和人工操作员，且其误报率显著低于 GPT-4o。这表明护栏级联架构能有效防止不必要的中断，这对担心 AI 引发停电的基础设施运营商至关重要。

关键参与者与案例研究

Anthropic 并非孤军奋战，但它是首个实现生产级部署的公司。关键参与者包括：

- Anthropic： 主要开发者。其策略聚焦于“安全优先”部署，直接与政府机构而非私营公用事业公司合作。他们已与15个国家电网运营商签署合同，包括英国、德国、日本和澳大利亚。
- OpenAI： 拥有竞争项目“GridMind”，但仍在测试阶段，仅模拟环境测试过。OpenAI 的方法更依赖人在回路验证，这增加了延迟。
- DeepMind： 其 AlphaGrid 系统专为优化设计（如减少能源浪费），但缺乏 Claude Mythos 的自主控制能力。DeepMind 专注于可再生能源预测而非直接操作。
- Siemens： 工业自动化巨头已与 Anthropic 合作提供硬件集成。Siemens 的 SCADA 系统现已预配置为接受 Claude Mythos 指令。

案例研究：英国国家电网

2025年2月，英国国家电网部署 Claude Mythos 管理频率响应——供需的实时平衡。此前，这需要12名操作员团队全天候工作。Claude Mythos 现自主处理85%的常规调整。2025年3月，一座500MW发电厂突然停运时，系统在200毫秒内自动触发需求侧响应（减少工业负荷），防止了大规模停电。

时间归档

常见问题

这次公司发布“Claude Mythos Takes Over 15 Nations: AI Now Directly Manages Critical Infrastructure”主要讲了什么？

Anthropic’s Claude Mythos has moved from controlled trials to live operations in 15 countries, taking direct control of essential services such as electricity distribution, water p…

从“Claude Mythos guardrail cascade architecture explained”看，这家公司的这次发布为什么值得关注？

Claude Mythos is not a modified chatbot; it is a purpose-built AI agent designed for zero-tolerance environments. The system’s architecture revolves around three core innovations: 1. Guardrail Cascade Architecture Tradit…

围绕“Anthropic reliability-as-a-service business model”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。

Claude Mythos 接管15国：AI 首次直接操控关键基础设施

技术深度解析

关键参与者与案例研究

更多来自 Hacker News

相关专题

时间归档

延伸阅读

常见问题