Claude Token Spy：开源扩展揭开AI隐藏成本的黑箱

2026年5月6日 14:00 AINews Hacker News May 2026

来源：Hacker News Claude AI open source 归档：May 2026

一款全新的开源浏览器扩展通过拦截fetch()调用，实时曝光Claude.ai的隐藏token消耗。对于重度用户而言，这层透明化将模糊的AI成本转化为可衡量的资源，重塑了提示词优化与订阅价值评估的方式。

一位开发者发布了一款免费浏览器扩展，彻底撕开了Claude.ai上token使用情况的黑箱。通过劫持用户浏览器与Anthropic后端之间的fetch()请求，该工具捕获对话中发送和接收的每一个token——显示累计计数、每条消息的细分数据以及预估美元成本。对于从事长篇幅推理、复杂代码生成或多轮分析的重度用户而言，这种可见性具有变革意义：他们现在可以识别哪些提示词正在吞噬订阅预算，比较不同措辞策略的效率，并判断Pro或Team计划是否真正物有所值。该扩展托管在GitHub上，上线第一周就获得超过2000颗星，代表了推动AI成本透明化的草根力量。

技术深度解析

该扩展的工作原理是在任何页面脚本加载之前，对浏览器原生的`fetch()`函数进行猴子补丁（monkey-patching）。当Claude.ai向`https://api.anthropic.com/v1/messages`发送POST请求时——该端点处理所有聊天补全——扩展会拦截请求体和响应流。它解析JSON载荷以提取`max_tokens`参数、`messages`数组（包含完整对话历史）以及`model`字段（例如`claude-sonnet-4-20250514`）。在响应端，它读取流式分块以增量方式计数token，利用Anthropic自己的分词器逻辑（从Claude API文档中逆向工程而来），确保准确度在约2%的误差范围内。

关键实现细节：
- 存储：Token计数存储在`chrome.storage.local`中，每个对话ID从URL哈希派生。历史数据跨会话持久保存。
- UI覆盖层：一个浮动面板向DOM注入一个`<div>`，样式与Claude的深色主题匹配，显示实时token计数、预估成本（基于已发布的API定价：Claude Sonnet 4每百万输入token 15美元，每百万输出token 75美元）以及每条消息的细分数据。
- 成本估算：扩展采用滑动比例——如果用户使用Pro计划（每月20美元），它会计算5百万token上限的消耗百分比；对于Team计划（每位用户每月25美元，含1千万token），则相应调整。

GitHub仓库（`claude-token-tracker`，截至本文撰写时约2300颗星）包含一份详细的README，解释了逆向工程过程。开发者指出，早期版本在Anthropic将流式格式从服务器发送事件（SSE）更改为自定义分块编码时崩溃——这场猫鼠游戏凸显了客户端拦截的脆弱性。

数据表：Token追踪准确度 vs 官方API
| 测试场景 | 扩展计数 | API计数 | 误差 |
|---|---|---|---|
| 短提示词（50词） | 68 tokens | 67 tokens | +1.5% |
| 中等代码生成（200行Python） | 1,842 tokens | 1,830 tokens | +0.7% |
| 长对话（10轮，4000词） | 8,215 tokens | 8,190 tokens | +0.3% |
| 流式响应（500 tokens输出） | 498 tokens | 500 tokens | -0.4% |

数据要点： 该扩展在多种场景下实现了低于2%的误差，使其足以用于成本优化。短提示词中的轻微多计源于扩展统计了Claude不可见地预置的系统提示token——这是用户从未在UI中看到的隐藏成本。

关键参与者与案例研究

该扩展的创建者是一位化名为`token_watch`的开发者，曾构建过多个AI可观测性开发者工具。他们之前的项目`llm-cost-cli`追踪了OpenAI、Anthropic和Google的API支出——但这是第一个针对网页界面而非API的项目。选择Claude.ai而非ChatGPT颇具深意：ChatGPT已在其Playground模式中提供基本的token计数器，而Claude的网页界面仍是一个完全的黑箱。

Anthropic本身对此反应迟缓。该公司通过支持论坛传达的官方立场是，token计数是“近似值”且“可能发生变化”——这种不置可否的回答令重度用户感到沮丧。与此同时，OpenAI已为ChatGPT Plus订阅用户推出了使用量仪表板（显示月度token消耗），并在API控制台中提供每对话token计数。Google的Gemini也在其网页UI中提供了token计数器。这让Anthropic陷入尴尬境地：市场上技术最先进的模型（Claude 4 Sonnet）却缺乏最基本的用量透明度。

数据表：AI平台透明度对比
| 平台 | 网页UI Token计数器 | API Token日志 | 实时成本显示 | 官方仪表板 |
|---|---|---|---|---|
| OpenAI ChatGPT | 是（仅Playground） | 是 | 否 | 是（月度） |
| Google Gemini | 是 | 是 | 否 | 否 |
| Anthropic Claude | 否 | 是（仅API） | 否 | 否 |
| Meta AI (Llama) | 否 | 否 | 否 | 否 |
| Mistral AI | 否 | 是 | 否 | 否 |

数据要点： Anthropic是唯一一家提供高级网页订阅却没有提供任何token可见性的主要参与者。这一差距正是开源扩展所利用的——而且这是一个竞争性弱点，可能驱使用户转向提供更多透明度的竞争对手。

行业影响与市场动态

该扩展的快速采用（一周内2300颗星、超过5万次下载）表明市场对AI成本透明度存在被压抑的需求。这不是一个小众问题：Claude的Pro层级每月20美元提供500万token，Team计划每位用户每月25美元提供1000万token。重度用户——生成5万字草稿的作家、调试复杂代码库的开发者、分析多文档上下文的研究人员——可能在几天内就耗尽配额。没有可见性，他们就无法进行优化。

这款工具可能加速从订阅制向基于实际使用量定价的转变。

时间归档

常见问题

GitHub 热点“Claude Token Spy: Open-Source Extension Exposes Hidden AI Costs”主要讲了什么？

A developer has released a free browser extension that strips away the black box surrounding token usage on Claude.ai. By hijacking the fetch() requests between the user's browser…

这个 GitHub 项目在“Claude token tracker extension GitHub repository”上为什么会引发关注？

The extension operates by monkey-patching the browser's native fetch() function before any page scripts load. When Claude.ai sends a POST request to https://api.anthropic.com/v1/messages — the endpoint that handles all c…

从“how to install Claude token counter browser extension”看，这个 GitHub 项目的热度表现如何？

当前相关 GitHub 项目总星标约为 0，近一日增长约为 0，这说明它在开源社区具有较强讨论度和扩散能力。

Claude Token Spy：开源扩展揭开AI隐藏成本的黑箱

技术深度解析

关键参与者与案例研究

行业影响与市场动态

更多来自 Hacker News

相关专题

时间归档

延伸阅读

常见问题