云巨头 vs AI智能体:亚马逊封禁Perplexity,开放创新面临威胁

Hacker News June 2026
来源:Hacker News归档:June 2026
亚马逊云服务(AWS)据报已限制Perplexity AI对其云基础设施的访问,此举引爆了一场激烈辩论:云平台是否有权单方面封禁智能体AI服务?这场冲突不仅考验基础设施供应商的权力边界,更可能重新定义自主AI智能体的竞争格局。

亚马逊云服务(AWS)与Perplexity AI之间暗流涌动的矛盾已升级为一场全面的行业危机,迫使业界从根本上重新审视云基础设施供应商与依赖它们的AI公司之间的关系。这场争议的核心在于:亚马逊的可接受使用政策(AUP)是否有正当理由将智能体AI——即那些能自主执行多步骤任务、与外部系统交互、并消耗大量计算资源的服务——归类为被禁止的“滥用”行为。以对话式搜索引擎闻名的Perplexity AI,其产品利用大语言模型实时合成信息,据报其访问AWS计算资源的权限已被限制或拒绝,这直接威胁到其规模化运营的能力。这并非孤立事件,而是云平台与新兴AI范式之间结构性矛盾的集中爆发。

技术深度解析

智能体AI服务与传统基于API的AI工作负载有着本质区别。一个典型的LLM API调用是无状态的:客户端发送提示词,模型生成回复,连接随即结束。相比之下,智能体AI维护持久状态,编排多步推理循环,调用外部工具(网络搜索、数据库、代码解释器),甚至可能生成子智能体。这种架构差异对云资源消耗和策略执行有着深远影响。

从技术角度看,Perplexity AI的搜索智能体完美体现了智能体模式。当用户提出一个复杂问题时,系统并非简单检索一个预计算好的答案。相反,它会:(1) 将查询分解为多个子问题,(2) 通过自有网络爬虫或第三方搜索API发起多个并行搜索请求,(3) 检索并排序数百份文档,(4) 利用LLM合成一个连贯的答案,并(5) 引用来源。这一过程每次查询消耗的计算资源是标准LLM推理调用的10到50倍,因为每一步都需要模型推理,而搜索检索管道的计算强度极高。

亚马逊AWS的可接受使用政策明确禁止“任何导致过度消耗资源(包括但不限于CPU、内存、磁盘空间或网络带宽)的服务使用行为”。模糊之处在于“过度”一词的定义。对于传统Web应用,“过度”可能意味着DDoS攻击。而对于智能体AI,正常运行本身就涉及持续的高资源利用率。AWS的内部监控系统——很可能基于CloudWatch异常检测——会将智能体工作负载标记为异常值,从而触发自动限流或人工审查。

智能体AI领域的开源项目清晰地展示了争议所涉及的技术模式。LangChain框架(GitHub: langchain-ai/langchain,10万+星标)为构建将LLM调用与工具使用串联起来的智能体提供了标准编排层。AutoGPT(GitHub: Significant-Gravitas/AutoGPT,17万+星标)普及了自主智能体的概念,这类智能体能够自行设定目标并执行多步骤计划。CrewAI(GitHub: joaomdmoura/crewAI,2.5万+星标)则实现了多智能体协作。这些框架都有一个共同特征:它们会产生不可预测、高频率的API调用和计算使用模式,极易超出标准云定价层的阈值。

性能对比:智能体AI vs. 传统AI工作负载

| 指标 | 传统LLM API(例如单次补全) | 智能体AI(例如Perplexity搜索智能体) | 比率 |
|---|---|---|---|
| 每次查询平均计算量(GPU小时) | 0.0001 | 0.005 – 0.05 | 50倍 – 500倍 |
| 每次查询模型调用次数 | 1 | 5 – 50 | 5倍 – 50倍 |
| 每次查询外部API调用次数 | 0 | 10 – 200 | 不适用 |
| 峰值内存使用量(GB) | 2 – 8 | 16 – 64 | 2倍 – 8倍 |
| 每次查询网络带宽(MB) | 0.1 | 10 – 100 | 100倍 – 1000倍 |

数据洞察: 智能体AI工作负载与传统AI不仅在数量上不同,其资源消耗模式在性质上也截然不同。云供应商传统的监控和定价模型从根本上缺乏区分合法智能体行为与滥用资源的能力。这种错位造成了一个监管真空,而云供应商正通过临时、不透明的执行措施来填补这一真空。

关键参与者与案例研究

亚马逊云服务(AWS): 全球最大的云供应商,2026年第一季度估计市场份额为32%,年收入超过1000亿美元。AWS的可接受使用政策对数百万客户而言就是事实上的法律。该公司在针对其认为的政策违规行为方面有激进执法的记录,包括限制加密货币挖矿工作负载以及因版权侵权而暂停账户。然而,这是首起涉及AI智能体公司的高调案例。

Perplexity AI: 由Aravind Srinivas、Denis Yarats等人于2022年创立,Perplexity已融资超过5亿美元,估值超过30亿美元。其核心产品是一款AI驱动的搜索引擎,利用智能体技术提供带有引用的合成答案。该公司据报严重依赖AWS来运行其推理基础设施,特别是托管其微调后的LLM以及运行网络爬取管道。Perplexity的商业模式依赖于低延迟、高吞吐量地访问云GPU。

其他云供应商: 谷歌云平台(GCP)和微软Azure正在密切关注事态发展。GCP拥有自己的AI智能体产品(Vertex AI Agent Builder),并可能借此机会吸引对AWS不满的客户。与OpenAI深度整合的Azure,在维护第三方智能体的开放生态系统方面有着既得利益,只要这些智能体不直接与微软的Copilot产品竞争。

竞争性智能体AI平台:

| 公司 | 产品 | 云依赖度 | 估算 |
|---|---|---|---|
| 待补充 | 待补充 | 待补充 | 待补充 |

更多来自 Hacker News

PHP迎来原生AI时代:Ext-Infer扩展让LLM直接运行在你的服务器上AINews独立验证,全新PHP扩展Ext-Infer允许开发者直接在PHP运行时中执行大语言模型(LLM)推理和嵌入向量生成。该扩展基于C++优化的llama.cpp库构建,可将量化模型(如Llama 3、Mistral和Gemma)加载Token经济学:重塑AI软件工程的隐形货币战争大语言模型(LLM)和AI编码智能体的崛起引入了一种新的隐形货币:Token。在传统软件工程中,时间是最稀缺的资源;而现在,Token预算才是真正的瓶颈。AINews分析显示,每次代码生成、调试循环和架构建议都会消耗可量化的Token数量,Gaia2基准测试揭露AI智能体致命缺陷:无法应对实时混乱AI行业长期以来一直推崇GSM8K和HumanEval等基准测试,这些测试衡量的是静态推理能力——在封闭环境中,一个单一问题对应一个单一答案。但真实的数字世界是混乱的:任务进行到一半时邮件涌入、网页更新、其他智能体介入。由多家顶尖AI研究实查看来源专题页Hacker News 已收录 4263 篇文章

时间归档

June 2026492 篇已发布文章

延伸阅读

Anthropic与微软Maia芯片谈判:定制AI硬件联盟的新纪元Anthropic正与微软就优先获取Maia AI芯片进行深入谈判。这款专为大规模AI工作负载设计的定制芯片,若达成独家协议,将标志着行业从依赖通用GPU向战略性垂直整合硬件合作伙伴关系的根本转变。黑石、H&F、高盛联手打造AI服务巨头:新玩法登场黑石集团、Hellman & Friedman与高盛集团联合推出了一家全新的企业级AI服务公司,此举标志着从零散的初创投资向垂直整合型AI平台的战略转变。该实体旨在解决AI部署的“最后一公里”难题,提供从模型微调到基础设施管理的一站式服务。三星集成Perplexity:被动浏览时代终结,智能体优先时代开启三星对其原生浏览器进行了根本性重构,将Perplexity AI的能力深度嵌入核心,超越对话式聊天机器人,打造出自主网络智能体。该集成使浏览器能解读用户高级意图(如规划旅行),并独立执行研究、比价、预订等任务。这标志着一个从被动查询到主动执PHP迎来原生AI时代:Ext-Infer扩展让LLM直接运行在你的服务器上Ext-Infer将Llama、Mistral等开源模型编译为原生PHP扩展,无需外部API即可在服务端完成推理。这不仅消除了网络延迟、降低了成本,更为全球最流行的Web语言解锁了离线AI能力。

常见问题

这次公司发布“Cloud Giants vs AI Agents: Amazon's Perplexity Ban Threatens Open Innovation”主要讲了什么?

The simmering conflict between Amazon Web Services and Perplexity AI has erupted into a full-blown industry crisis, forcing a fundamental reexamination of the relationship between…

从“Can AWS legally ban Perplexity AI from using its cloud services?”看,这家公司的这次发布为什么值得关注?

Agentic AI services differ fundamentally from traditional API-based AI workloads. A typical LLM API call is stateless: the client sends a prompt, the model generates a response, and the connection ends. An agentic AI, by…

围绕“What are the alternatives to AWS for hosting AI agents?”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。