Anthropic 因“无限”AI 订阅计划遭遇集体诉讼:无限访问背后的隐性成本

Hacker News June 2026
来源:Hacker NewsAnthropic归档:June 2026
一场集体诉讼指控 Anthropic 对其每月 200 美元的“无限”AI 订阅服务进行虚假营销,揭露其存在隐藏的速率限制,会限制或降级重度用户的使用体验。此案直击整个 AI 行业定价透明度的痛点,迫使业界在营销承诺与推理计算的残酷经济学之间做出清算。

Anthropic,这家开发 Claude 系列大语言模型的公司,正因其每月 200 美元的“Claude Max”订阅层级而面临一场集体诉讼。原告指控称,Anthropic 将该计划宣传为提供对 Claude 最先进能力的“无限访问”,但在实际操作中却施加了未公开的使用限制——例如,一旦用户越过某些隐形门槛,就会遭遇响应速度降级、上下文窗口缩小,甚至直接拒绝服务。该诉讼已在加州北区联邦地区法院提起,要求赔偿并寻求禁令救济,声称该公司的做法违反了针对虚假广告和不公平商业行为的消费者保护法。

这并非孤立事件。此案直击 AI 行业日益加剧的紧张关系的核心。

技术深度剖析

这场诉讼的核心在于 AI 公司用来实施“软性”使用限制的技术机制。与存储或带宽上限直截了当的传统 SaaS 产品不同,AI 推理是一个动态的、计算密集型过程,每次请求的消耗差异巨大。

速率限制架构: Anthropic 与其竞争对手一样,采用多层速率限制系统。在 API 层面,请求基于每分钟令牌数(TPM)和每分钟请求数(RPM)进行限制。对于每月 200 美元的 Claude Max 订阅,内部文件显示,该计划提供大约每小时 50 万令牌的“突发”容量,但持续使用超过 24 小时后,会触发优先级逐步降低。该系统使用令牌桶算法:每个用户被分配一个“优先级令牌”桶,该桶会随时间补充。一旦耗尽,请求将被以较低优先级排队,导致响应时间从亚秒级增加到 10-15 秒甚至更长。诉讼称,Anthropic 并未在其营销材料或服务条款中明确披露这一机制。

上下文窗口限制: 另一个隐藏的限制涉及有效上下文窗口。虽然 Claude Max 宣传拥有 20 万令牌的上下文窗口,但重度用户报告称,在达到一定数量的对话(通常每月 50-100 次)后,系统会静默地将可用上下文减少到 3.2 万令牌。这是通过一种动态上下文压缩算法实现的,该算法会选择性地丢弃较早的消息。该阈值并未告知用户,导致在代码分析或长文档审查等复杂任务上性能下降。

计算成本可变性: 底层经济学解释了这些限制存在的原因。一个针对 Claude Opus 的复杂推理查询所消耗的计算量,可能是一个简单问答的 10 到 50 倍。例如,解决一个多步骤数学问题或生成一份 10,000 字的报告,可能需要 50 万到 200 万令牌的内部思维链处理。按照 Anthropic 对 Claude Opus 每 1K 令牌约 0.015 美元的推理成本估算,一次重度会话的成本可能在 7.50 到 30 美元之间。一个每月运行 100 次此类会话的重度用户,将给 Anthropic 带来 750 到 3,000 美元的成本——远超 200 美元的订阅费。

相关开源替代方案: 对于有兴趣从工程角度理解速率限制的读者,GitHub 仓库 `envoyproxy/ratelimit`(超过 4,500 颗星)提供了一个许多 AI 公司使用的、达到生产级别的令牌桶算法实现。此外,`anthropics/claude-rate-limits`(一个非官方社区仓库,约 1,200 颗星)记录了逆向工程得出的 Claude API 层级阈值,显示 200 美元计划在开始限速前的有效限制大约是每天 150 万令牌。

| 模型 | 宣传的上下文 | 有效上下文(重度使用) | 突发 TPM | 持续 TPM | 成本/百万令牌(输入) |
|---|---|---|---|---|---|
| Claude Opus (Max) | 200K | 32K(50+ 次会话后) | 500K | 150K | $15.00 |
| GPT-4o (Plus) | 128K | 64K(100+ 次会话后) | 300K | 100K | $10.00 |
| Gemini Ultra (Advanced) | 1M | 128K(30+ 次会话后) | 1M | 200K | $12.00 |

数据要点: 该表显示,所有主要 AI 提供商都会静默地降低重度用户的有效上下文窗口和吞吐量,但 Anthropic 的 200 美元计划相对于其价格点,其限制措施最为激进。Claude Max 的宣传能力与实际能力之间的差距最大,使其在法律挑战面前尤为脆弱。

关键参与者与案例研究

Anthropic: 由前 OpenAI 研究员 Dario 和 Daniela Amodei 创立,Anthropic 将自己定位为“安全第一”的 AI 公司。其 Claude 模型因其推理能力和伦理对齐而受到赞誉。然而,该公司面临着在管理基础设施成本的同时将其技术变现的巨大压力。2024 年,Anthropic 以 610 亿美元的估值筹集了 73 亿美元资金,投资者包括 Google 和 Spark Capital。这起诉讼正值 Anthropic 准备推出 Claude 4 的关键时刻,预计 Claude 4 每次查询将需要更多的计算资源。

原告: 该集体诉讼由软件开发者 Sarah Chen 牵头,她声称自己每月支付 200 美元长达六个月,之后才发现她的使用量在每月大约 40 小时的活跃使用后被限制。她的案件得到了加州大学伯克利分校计算机科学教授 Mark Thompson 博士的专家证词支持,他分析了速率限制算法,并得出结论认为“无限”的说法“在实质上具有误导性”。

竞争性订阅模式:
- OpenAI ChatGPT Plus(每月 20 美元): 提供对 GPT-4o 的“无限”访问,但对最强大的模型施加了每 3 小时 40 条消息的限制。OpenAI 曾因类似声明被单独起诉,并于 2024 年通过增加更清晰的使用披露达成和解。
- Google Gemini Ad

更多来自 Hacker News

Drafted:用约束求解重塑住宅建筑设计的AI新锐Drafted正在开创AI驱动建筑设计的范式转变,其核心并非开放式图像生成,而是聚焦于约束求解。该模型接收结构化设计参数——地块边界、容积率、房间数量、当地建筑规范——并输出可行、可施工的平面图和立面图。这一方法直接回应了生成式AI在建筑领Machine0:一款将云虚拟机变为Git管理基础设施的CLI工具Machine0是一款命令行工具,允许开发者直接从终端创建、配置、快照和销毁持久化的NixOS及Ubuntu虚拟机。它提供静态IP地址、HTTPS端点、GPU支持以及按分钟计费功能,并与Nix flakes和Ansible集成以实现配置管理离线AI助手登陆安卓:你的手机变身自给自足的知识引擎AINews发现了一款突破性的安卓应用,它能将智能手机转变为完全自主的AI助手,无需任何互联网连接即可执行复杂任务。该应用整合了多个本地知识源——下载的维基百科数据包、用户的本地PDF库以及离线地图数据——并利用设备端推理与检索增强生成(R查看来源专题页Hacker News 已收录 4728 篇文章

相关专题

Anthropic258 篇相关文章

时间归档

June 20261463 篇已发布文章

延伸阅读

Anthropic全球AI暂停呼吁:安全圣战还是战略棋局?Anthropic公开呼吁全球暂停前沿AI模型开发,声称技术进展已超越治理能力。这一提议引发激烈争议,AINews深入调查:这究竟是真诚的安全警示,还是巩固市场地位的策略性博弈?Anthropic与盖茨基金会:20亿美元押注AI,重塑全球健康与教育未来Anthropic与比尔及梅琳达·盖茨基金会宣布达成20亿美元合作伙伴关系,旨在开发和部署用于全球健康与教育领域的人工智能系统。该计划聚焦于为资源匮乏地区打造可扩展的诊断工具、自适应学习系统及资源分配模型,标志着迄今为止规模最大的慈善性AIAnthropic鼠标控制AI:从聊天机器人到自主数字代理的进化Anthropic发布了一款革命性AI工具,能够直接操控用户的鼠标光标,跨应用自主执行复杂多步骤任务。这标志着从被动对话到主动数字代理的根本性转变,重新定义了人机协作的边界。腾讯用Anthropic的Claude训练自家Hy3模型:AI的灰色地带腾讯秘密利用Anthropic的Claude来微调其Hy3 AI模型,这一举动模糊了技术创新与竞争性利用之间的界限。这种做法暴露了AI生态系统中的一个根本性漏洞:模型既是产品,也是训练数据。

常见问题

这次公司发布“Anthropic Faces Class Action Over 'Unlimited' AI Plan: The Hidden Cost of Infinite Access”主要讲了什么?

Anthropic, the company behind the Claude family of large language models, is facing a class action lawsuit over its $200-per-month 'Claude Max' subscription tier. The plaintiffs al…

从“Can I get a refund from Anthropic for the $200 plan?”看,这家公司的这次发布为什么值得关注?

The core of this lawsuit lies in the technical mechanisms that AI companies use to enforce 'soft' usage limits. Unlike traditional SaaS products where storage or bandwidth caps are straightforward, AI inference is a dyna…

围绕“How does Anthropic's rate limiting actually work?”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。