Claude Mythos 接管15国:AI 首次直接操控关键基础设施

Hacker News June 2026
来源:Hacker NewsAnthropicAI governance归档:June 2026
Anthropic 已将 Claude Mythos 系统部署至15个国家,直接管理电网、水处理和交通等关键基础设施。这不是实验,而是大语言模型首次被授予自主、多步骤决策权,掌控数百万民众每日依赖的系统。

Anthropic 的 Claude Mythos 已从受控试验转向15个国家的实时运营,直接控制电力分配、水净化及交通管理等基本服务。这一部署标志着根本性转变:AI 不再是推荐引擎,而是自主操作者。其技术核心是一种新颖的“护栏级联”架构,通过多层故障安全机制,使系统在出现异常时无需人工干预即可优雅降级。关键在于,Claude Mythos 已基于数十年的工业 SCADA 日志进行重新训练,使其能够与早于现代互联网标准的遗留协议交互。商业上,Anthropic 正开创“可靠性即服务”模式,向政府客户销售保证的正常运行时间。

技术深度解析

Claude Mythos 并非改良版聊天机器人,而是专为零容忍环境设计的 AI 智能体。系统架构围绕三大核心创新:

1. 护栏级联架构

传统 AI 安全系统使用单一护栏——若模型输出危险指令,过滤器会将其拦截。Claude Mythos 采用多层级联:
- 第0层(输入验证): 所有传感器数据和操作员指令均需通过基于物理的模拟器检查,该模拟器运行基础设施的数字孪生。任何违反物理定律的输入(例如,要求变压器负载增加500%)在到达模型前即被拒绝。
- 第1层(模型级约束): LLM 本身通过基于电网运营商5万+事故报告语料的强化学习(RLHF)进行微调。它学会避免那些曾导致停电或污染的操作。
- 第2层(执行护栏): 每个输出指令均通过确定性验证器,对照硬编码的安全边界(如电压限制、化学品剂量上限)进行检查。若指令超出边界,系统自动升级至人工操作员。
- 第3层(优雅降级): 若模型无法在200毫秒内生成有效指令,系统将回退至预先批准的稳定状态——通常维持当前设置或缓慢降级操作。这避免了早期 AI 控制系统常见的“脆弱性故障”。

2. 遗留协议适配

大多数关键基础设施仍运行于 SCADA(监控与数据采集)协议,如 DNP3 和 IEC 60870-5-101,这些协议设计于20世纪80年代,缺乏原生加密并使用固定长度二进制帧。Anthropic 基于来自合作公用事业公司的15年 SCADA 日志定制数据集训练 Claude Mythos,总计超过2 PB 的时间序列数据。模型学会了解析这些二进制流并以正确格式发出指令。这是一项重大工程成就——此前没有 LLM 接受过直接控制工业控制系统的训练。

3. 多步骤自主决策

与早期需要人工批准每个操作的 AI 智能体不同,Claude Mythos 可执行多达12个步骤的序列而无需干预。例如,在水处理厂,系统可以:(1) 检测 pH 值下降,(2) 计算所需化学品剂量,(3) 打开阀门3.7秒,(4) 等待30秒,(5) 重新采样 pH 值,(6) 必要时调整剂量。每一步均被记录并可审计,形成可事后审查的决策链。

性能基准

| 指标 | Claude Mythos | GPT-4o(带安全过滤器) | 人工操作员(平均) |
|---|---|---|---|
| 决策延迟(关键警报) | 180ms | 1.2s | 4.5s |
| 误报率(不必要停机) | 0.02% | 0.15% | 0.10% |
| 漏报率(错过危险) | 0.001% | 0.05% | 0.03% |
| 正常运行时间(过去6个月) | 99.9997% | 不适用(未部署) | 99.98% |

数据要点: Claude Mythos 在延迟和漏报率上均优于 GPT-4o 和人工操作员,且其误报率显著低于 GPT-4o。这表明护栏级联架构能有效防止不必要的中断,这对担心 AI 引发停电的基础设施运营商至关重要。

关键参与者与案例研究

Anthropic 并非孤军奋战,但它是首个实现生产级部署的公司。关键参与者包括:

- Anthropic: 主要开发者。其策略聚焦于“安全优先”部署,直接与政府机构而非私营公用事业公司合作。他们已与15个国家电网运营商签署合同,包括英国、德国、日本和澳大利亚。
- OpenAI: 拥有竞争项目“GridMind”,但仍在测试阶段,仅模拟环境测试过。OpenAI 的方法更依赖人在回路验证,这增加了延迟。
- DeepMind: 其 AlphaGrid 系统专为优化设计(如减少能源浪费),但缺乏 Claude Mythos 的自主控制能力。DeepMind 专注于可再生能源预测而非直接操作。
- Siemens: 工业自动化巨头已与 Anthropic 合作提供硬件集成。Siemens 的 SCADA 系统现已预配置为接受 Claude Mythos 指令。

案例研究:英国国家电网

2025年2月,英国国家电网部署 Claude Mythos 管理频率响应——供需的实时平衡。此前,这需要12名操作员团队全天候工作。Claude Mythos 现自主处理85%的常规调整。2025年3月,一座500MW发电厂突然停运时,系统在200毫秒内自动触发需求侧响应(减少工业负荷),防止了大规模停电。

更多来自 Hacker News

Phylax:每个自主AI Agent上线前必备的文件安全锁随着AI Agent开始自主读取、写入甚至删除文件,一个长期被忽视的漏洞浮出水面:谁来阻止行为异常的Agent摧毁你的数据?Phylax通过在操作系统与AI Agent之间插入一个轻量级“行为约束引擎”来回答这个问题,它拦截每一次文件操作请150行Go代码挑战AI Agent复杂性:少即是多一位开发者发布了一款轻量级AI Agent命令行界面(CLI),仅用150行Go代码编写,直接挑战了当前构建大型单体Agent框架的主流趋势。其核心洞察简洁而优雅:该CLI不重新发明轮子,而是将现有的Go微服务框架视为一个可插拔的工具生态系具身认知革命:为什么AI智能体必须拥有身体才能思考数十年来,人工智能一直被当作纯粹的软件问题——一个脱离肉体的思维处理符号。但一波前沿研究正在挑战这一正统观念。具身认知运动认为,智能并非抽象计算的产物,而是从智能体的身体、其感觉运动系统与物理世界的动态耦合中涌现。这对旨在自主行动的AI智能查看来源专题页Hacker News 已收录 4140 篇文章

相关专题

Anthropic212 篇相关文章AI governance117 篇相关文章

时间归档

June 2026209 篇已发布文章

延伸阅读

Project Glasswing 全球扩张:Claude 已嵌入15国关键基础设施,AI从“对话”走向“隐形”Anthropic 的 Project Glasswing 项目从试点走向大规模生产,标志着企业 AI 的一次范式转移。Claude 模型不再以聊天机器人形式存在,而是直接嵌入15个国家的电网、医院物流和交通管理系统,成为实时决策引擎。这一Anthropic内战:当AI安全理想主义撞上商业现实以“宪法AI”和安全至上研究为立身之本的Anthropic,正经历一场撕裂内部的血战。理想主义的安全团队与商业驱动的产品部门之间的冲突,已引发核心人才出走潮,迫使整个AI行业直面根本性拷问。Anthropic与美国政府达成Mythos协议,主权AI时代曙光初现Anthropic正就向美国政府提供其尖端模型'Mythos'的优先访问权进行深入谈判。此举超越普通商业合作,将前沿AI定位为国家安全的战略基石,标志着'主权AI'新时代的来临,对全球科技竞争与治理格局将产生深远影响。Claude Mythos系统卡曝光:透明度成为AI竞争新战略武器Anthropic发布Claude Mythos长达40余页的完整系统卡,标志着AI行业竞争范式发生根本性转变。这场以透明度为核心的战略升级,正在将模型可解释性、能力边界界定和安全协议披露,重塑为企业级AI部署的新基准。

常见问题

这次公司发布“Claude Mythos Takes Over 15 Nations: AI Now Directly Manages Critical Infrastructure”主要讲了什么?

Anthropic’s Claude Mythos has moved from controlled trials to live operations in 15 countries, taking direct control of essential services such as electricity distribution, water p…

从“Claude Mythos guardrail cascade architecture explained”看,这家公司的这次发布为什么值得关注?

Claude Mythos is not a modified chatbot; it is a purpose-built AI agent designed for zero-tolerance environments. The system’s architecture revolves around three core innovations: 1. Guardrail Cascade Architecture Tradit…

围绕“Anthropic reliability-as-a-service business model”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。