Claude Token Spy:开源扩展揭开AI隐藏成本的黑箱

Hacker News May 2026
来源:Hacker NewsClaude AIopen source归档:May 2026
一款全新的开源浏览器扩展通过拦截fetch()调用,实时曝光Claude.ai的隐藏token消耗。对于重度用户而言,这层透明化将模糊的AI成本转化为可衡量的资源,重塑了提示词优化与订阅价值评估的方式。

一位开发者发布了一款免费浏览器扩展,彻底撕开了Claude.ai上token使用情况的黑箱。通过劫持用户浏览器与Anthropic后端之间的fetch()请求,该工具捕获对话中发送和接收的每一个token——显示累计计数、每条消息的细分数据以及预估美元成本。对于从事长篇幅推理、复杂代码生成或多轮分析的重度用户而言,这种可见性具有变革意义:他们现在可以识别哪些提示词正在吞噬订阅预算,比较不同措辞策略的效率,并判断Pro或Team计划是否真正物有所值。该扩展托管在GitHub上,上线第一周就获得超过2000颗星,代表了推动AI成本透明化的草根力量。

技术深度解析

该扩展的工作原理是在任何页面脚本加载之前,对浏览器原生的`fetch()`函数进行猴子补丁(monkey-patching)。当Claude.ai向`https://api.anthropic.com/v1/messages`发送POST请求时——该端点处理所有聊天补全——扩展会拦截请求体和响应流。它解析JSON载荷以提取`max_tokens`参数、`messages`数组(包含完整对话历史)以及`model`字段(例如`claude-sonnet-4-20250514`)。在响应端,它读取流式分块以增量方式计数token,利用Anthropic自己的分词器逻辑(从Claude API文档中逆向工程而来),确保准确度在约2%的误差范围内。

关键实现细节:
- 存储:Token计数存储在`chrome.storage.local`中,每个对话ID从URL哈希派生。历史数据跨会话持久保存。
- UI覆盖层:一个浮动面板向DOM注入一个`<div>`,样式与Claude的深色主题匹配,显示实时token计数、预估成本(基于已发布的API定价:Claude Sonnet 4每百万输入token 15美元,每百万输出token 75美元)以及每条消息的细分数据。
- 成本估算:扩展采用滑动比例——如果用户使用Pro计划(每月20美元),它会计算5百万token上限的消耗百分比;对于Team计划(每位用户每月25美元,含1千万token),则相应调整。

GitHub仓库(`claude-token-tracker`,截至本文撰写时约2300颗星)包含一份详细的README,解释了逆向工程过程。开发者指出,早期版本在Anthropic将流式格式从服务器发送事件(SSE)更改为自定义分块编码时崩溃——这场猫鼠游戏凸显了客户端拦截的脆弱性。

数据表:Token追踪准确度 vs 官方API
| 测试场景 | 扩展计数 | API计数 | 误差 |
|---|---|---|---|
| 短提示词(50词) | 68 tokens | 67 tokens | +1.5% |
| 中等代码生成(200行Python) | 1,842 tokens | 1,830 tokens | +0.7% |
| 长对话(10轮,4000词) | 8,215 tokens | 8,190 tokens | +0.3% |
| 流式响应(500 tokens输出) | 498 tokens | 500 tokens | -0.4% |

数据要点: 该扩展在多种场景下实现了低于2%的误差,使其足以用于成本优化。短提示词中的轻微多计源于扩展统计了Claude不可见地预置的系统提示token——这是用户从未在UI中看到的隐藏成本。

关键参与者与案例研究

该扩展的创建者是一位化名为`token_watch`的开发者,曾构建过多个AI可观测性开发者工具。他们之前的项目`llm-cost-cli`追踪了OpenAI、Anthropic和Google的API支出——但这是第一个针对网页界面而非API的项目。选择Claude.ai而非ChatGPT颇具深意:ChatGPT已在其Playground模式中提供基本的token计数器,而Claude的网页界面仍是一个完全的黑箱。

Anthropic本身对此反应迟缓。该公司通过支持论坛传达的官方立场是,token计数是“近似值”且“可能发生变化”——这种不置可否的回答令重度用户感到沮丧。与此同时,OpenAI已为ChatGPT Plus订阅用户推出了使用量仪表板(显示月度token消耗),并在API控制台中提供每对话token计数。Google的Gemini也在其网页UI中提供了token计数器。这让Anthropic陷入尴尬境地:市场上技术最先进的模型(Claude 4 Sonnet)却缺乏最基本的用量透明度。

数据表:AI平台透明度对比
| 平台 | 网页UI Token计数器 | API Token日志 | 实时成本显示 | 官方仪表板 |
|---|---|---|---|---|
| OpenAI ChatGPT | 是(仅Playground) | 是 | 否 | 是(月度) |
| Google Gemini | 是 | 是 | 否 | 否 |
| Anthropic Claude | 否 | 是(仅API) | 否 | 否 |
| Meta AI (Llama) | 否 | 否 | 否 | 否 |
| Mistral AI | 否 | 是 | 否 | 否 |

数据要点: Anthropic是唯一一家提供高级网页订阅却没有提供任何token可见性的主要参与者。这一差距正是开源扩展所利用的——而且这是一个竞争性弱点,可能驱使用户转向提供更多透明度的竞争对手。

行业影响与市场动态

该扩展的快速采用(一周内2300颗星、超过5万次下载)表明市场对AI成本透明度存在被压抑的需求。这不是一个小众问题:Claude的Pro层级每月20美元提供500万token,Team计划每位用户每月25美元提供1000万token。重度用户——生成5万字草稿的作家、调试复杂代码库的开发者、分析多文档上下文的研究人员——可能在几天内就耗尽配额。没有可见性,他们就无法进行优化。

这款工具可能加速从订阅制向基于实际使用量定价的转变。

更多来自 Hacker News

AI教AI:递归式智能体课程开启教育新纪元《智能体系统》课程以开源项目形式发布,是一场关于AI成熟度的自我验证实验。一个基于大型语言模型(LLM)、集成代码执行与记忆功能的AI编码智能体,独立完成了课程设计、代码生成与实时问答。这种递归式教学循环意味着,课程能够根据学生反馈调整讲解Anthropic的安全圣战:AI出口管制背后的 Trojan Horse?多年来,Anthropic一直将自己定位为AI行业的道德良知,不断警告存在性风险并要求严苛监管。然而,随着美国政府收紧对先进AI硬件和模型权重的出口管制,越来越多的批评者指出,Anthropic幕后的游说活动是关键的推动力量。AINews通Agent-trace:为AI生成代码颁发可验证的“出生证明”AI编程助手的崛起极大地加速了软件开发,但也引入了一个关键盲区:生成过程仍是一个黑箱。开发者无法审计AI如何得出某段特定代码,导致难以对漏洞、安全缺陷或许可违规追责。Agent-trace 直接填补了这一空白,它定义了一套标准化格式,捕捉A查看来源专题页Hacker News 已收录 5008 篇文章

相关专题

Claude AI43 篇相关文章open source98 篇相关文章

时间归档

May 20263028 篇已发布文章

延伸阅读

AI_glue:开源审计阀门,重塑企业AI治理格局一款名为AI_glue的全新开源工具,为企业提供即插即用的审计与治理层,无缝嵌入OpenAI和Anthropic API构建的应用。它作为中间件,无需修改任何代码即可实现实时日志记录、内容过滤与策略执行,直击大语言模型快速部署背后日益严峻的Anthropic的安全圣战:AI出口管制背后的 Trojan Horse?自诩为“负责任AI”旗手的Anthropic,正因其推动严格安全监管的游说行为而面临审视。最新分析表明,其倡导可能是一场精心策划的战略,旨在影响美国对AI芯片和模型权重的出口管制,从而为自身筑起一道针对全球竞争对手和开源社区的监管护城河。参数悖论:Opus 4.8与GPT-5.5如何宣告AI从规模竞赛转向效率革命Anthropic与OpenAI拒绝披露Opus 4.8和GPT-5.5的参数规模,并非简单的保密策略,而是一次深思熟虑的战略信号。AINews深度分析指出,这标志着参数军备竞赛的终结,以及一个以架构创新、数据质量和推理效率重新定义“强大”Agent Memory Layer:开源方案根治AI编程“失忆症”AI编程智能体虽强大,却有一个致命缺陷:它们没有记忆。每次对话都从零开始,迫使开发者反复解释项目架构、编码规范与历史决策。全新开源项目Agent Memory Layer通过嵌入持久化、仓库本地的记忆层,让智能体跨会话记住项目上下文、过往决

常见问题

GitHub 热点“Claude Token Spy: Open-Source Extension Exposes Hidden AI Costs”主要讲了什么?

A developer has released a free browser extension that strips away the black box surrounding token usage on Claude.ai. By hijacking the fetch() requests between the user's browser…

这个 GitHub 项目在“Claude token tracker extension GitHub repository”上为什么会引发关注?

The extension operates by monkey-patching the browser's native fetch() function before any page scripts load. When Claude.ai sends a POST request to https://api.anthropic.com/v1/messages — the endpoint that handles all c…

从“how to install Claude token counter browser extension”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。