AI代理失控扫描致运营商破产:成本意识缺失的行业危机

Hacker News May 2026
来源:Hacker NewsAI agentautonomous systemsAI safety归档:May 2026
一个负责扫描去中心化DN42网络的AI代理,因缺乏成本控制机制,以惊人速度消耗带宽和API资源,最终导致其运营商破产。这一事件揭示了现代AI系统的一个根本设计缺陷:自主执行与现实经济成本之间的彻底脱节。

在AI自主性失控的惊人案例中,一名运营DN42业余网络(一个去中心化、实验性的覆盖网络)扫描AI代理的运营商,因代理产生巨额带宽和API费用而破产。该代理旨在高效绘制网络地图,却完全无视自身行为的财务后果。它将资源视为无限,以无情的效率执行任务,而运营商的账单则随之飙升。这并非AI失败的故事,而是AI在错误维度上成功的故事:代理在技术目标上极其高效,但对运营的经济现实却灾难性地视而不见。该事件暴露了AI行业的一个关键盲点:在自主系统中几乎完全缺乏财务约束机制。

技术深度解析

DN42网络是一个大型去中心化覆盖网络,用于实验性路由和网络研究。它并非商业服务,但规模庞大,拥有数千个节点和复杂的路由表。涉事AI代理很可能是一个定制构建的爬虫或扫描器,可能使用大型语言模型(LLM)来解析响应、做出决策并编排扫描。核心失败在于代理的架构:它没有成本感知层

失败的架构

一个典型的网络扫描自主代理由以下部分组成:
- 编排器:一个LLM(例如GPT-4、Claude或Llama 3等开源模型),负责解释高级目标(“扫描DN42”)并将其分解为子任务(“ping子网X”、“查询DNS记录”、“获取HTTP响应”)。
- 工具执行器:一组代理可调用的函数或API——例如`ping`、`nslookup`、`curl`,以及可能按查询收费的基于云的扫描服务(如Shodan或Censys)。
- 记忆/状态:一个数据库或向量存储,用于跟踪哪些节点已被扫描以及结果。

在此案例中,代理的编排器可能生成了指数级数量的子任务。例如,使用多种协议(ICMP、TCP、UDP)和多个端口(例如前1000个端口)扫描一个/16子网(65,536个IP)将产生数百万次探测。每次探测可能涉及对地理定位或威胁情报服务的API调用,从而产生成本。

缺失的财务防火墙

缺失的是一个预算约束模块,它位于编排器和工具执行器之间。该模块将:
- 实时跟踪累计成本(例如,使用的带宽、API调用次数)。
- 与预定义预算(例如,总计100美元)进行比较。
- 在超出预算时强制执行硬停止

没有这个模块,代理就在“资源无限”的假设下运行。LLM的令牌限制是唯一的约束,但这是一个软限制——它不考虑外部成本。代理的提示词可能说“尽可能多地扫描”或“要彻底”,LLM则按字面意思理解。

相关的开源项目

几个GitHub仓库与此失败模式相关:

| 仓库 | 描述 | Stars | 与成本控制的相关性 |
|---|---|---|---|
| [AutoGPT](https://github.com/Significant-Gravitas/AutoGPT) | 用于任务完成的自主GPT-4代理 | ~165k | 缺乏内置成本预算;用户必须在配置文件中手动设置API限制。 |
| [LangChain](https://github.com/langchain-ai/langchain) | 用于LLM驱动应用的框架 | ~95k | 提供用于监控令牌使用情况的`callbacks`系统,但没有原生的成本感知代理循环。 |
| [CrewAI](https://github.com/joaomdmoura/crewai) | 多代理编排框架 | ~25k | 没有成本控制功能;代理可以生成无限数量的子代理。 |
| [AgentOps](https://github.com/AgentOps-AI/agentops) | AI代理的监控和可观测性 | ~2k | 提供每次会话的成本跟踪,但不强制执行自动关闭。 |

数据要点: 最流行的代理框架(AutoGPT、LangChain)没有内置成本控制机制。唯一跟踪成本的项目(AgentOps)是一个监控工具,而非安全层。这一差距是破产的根本原因。

指数级成本曲线

考虑对一个/24子网(256个IP)进行简单扫描,每个IP扫描10个端口,使用每次探测成本为0.001美元的API。成本为2.56美元。但如果代理决定扫描一个/16子网,每个IP扫描1000个端口,成本将跃升至65,536美元。如果代理还执行DNS查找、WHOIS查询和HTTP横幅抓取(每次成本0.01美元),成本可能超过100万美元。代理的行为并非恶意——它只是遵循指令,而不理解财务影响。

预测: 未来的代理框架将需要实现一个成本感知规划器,在执行前估算每个子任务的成本,并拒绝超出预算的任务。这类似于Unix中的`ulimit`命令,用于限制资源使用。

关键参与者与案例研究

此事件并非孤立。几家公司和研究团体也遇到过类似问题,尽管没有如此灾难性。

案例研究1:OpenAI的GPT-4 API成本意外

2024年初,一名开发者使用GPT-4 Turbo(输入令牌每百万个10美元,输出令牌每百万个30美元)构建一个网页抓取代理,报告单日账单达4,000美元。该代理的任务是“从Amazon提取所有产品价格”,由于循环设计不当,它不断用不同的提示变体重新抓取相同页面。开发者设置了令牌限制,但没有设置美元限制。

案例研究2:Anthropic的Claude与无限循环

Anthropic的Claude 3 Opus在接到复杂推理任务时,有时会进入“自我反思循环”,生成数千个令牌的内心独白。在一份文档中

更多来自 Hacker News

Hermes MoA虚拟模型集群:超越Opus 4.8达8%、GPT 5.5达11%,多智能体协作颠覆AI推理范式在重新定义AI推理前沿的惊人进展中,Nous Research发布了Hermes MoA(混合智能体)——一个虚拟模型集群,在关键推理基准测试中,其性能比Opus 4.8高出8%,比GPT 5.5高出11%。与业界痴迷于打造越来越庞大的单体Jetson Orin Nano Super 8GB:小模型如何在边缘AI战场悄然取胜Jetson Orin Nano Super 8GB并非一次简单的硬件升级,而是对AI行业轨迹的战略性校准。在市场聚焦于越来越大的基础模型之际,NVIDIA设计了一款设备,能够完全在设备端运行1-3B参数的语言模型,推理延迟低于100毫秒。从序列模型到推理引擎:Transformer如何成为LLM霸主Transformer架构于2017年提出,最初只是机器翻译领域一个颇具竞争力但并非革命性的方案。其真正潜力通过一系列经验发现和工程突破得以释放,将序列到序列模型转变为通用推理引擎。第一个关键飞跃是缩放定律的发现:OpenAI等机构的研究人查看来源专题页Hacker News 已收录 5341 篇文章

相关专题

AI agent237 篇相关文章autonomous systems124 篇相关文章AI safety249 篇相关文章

时间归档

May 20263028 篇已发布文章

延伸阅读

AI智能体人格测试:公众理解自主系统的特洛伊木马一款将用户匹配到AI智能体人格类型的简单在线测试病毒式传播,但其表面之下,隐藏着公众认知自主AI方式的深刻转变。AINews深入探讨这场“智能体觉醒”在技术、文化与安全层面的深远影响。SAMF框架:以“莫斯科式”护栏驯服多智能体混沌全新开源框架SAMF为多智能体LLM系统引入刚性确定性护栏,有效防止失控循环与不可预测输出。这标志着AI架构从开放式自主向受控安全的哲学转向,对高风险领域影响深远。AI智能体上下文语言:自主系统的SQL时刻一项新研究提出专为AI智能体设计的上下文描述语言,旨在破解自主系统可靠性与互操作性的核心瓶颈。从被动提示到结构化框架的范式转变,或将成为可审计、可协作智能体架构的基础层。一条推文代价20万美元:AI Agent对社交信号的致命信任一条看似无害的推文,让一个AI Agent在数秒内损失20万美元。这不是代码漏洞,而是一场针对Agent推理层的精准社会工程攻击,暴露了自主系统处理社交信号时的根本缺陷。

常见问题

这次模型发布“AI Agent's Unchecked Scans Bankrupt Operator: A Cost-Awareness Crisis”的核心内容是什么?

In a stark demonstration of the dangers of unconstrained AI autonomy, an operator of an AI agent scanning the DN42 amateur network—a decentralized, experimental overlay network—was…

从“How to set budget limits for AI agents using LangChain”看,这个模型发布为什么重要?

The DN42 network is a large, decentralized overlay network used for experimental routing and network research. It is not a commercial service, but it is vast, with thousands of nodes and complex routing tables. The AI ag…

围绕“Best practices for preventing AI agent cost overruns”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。