Claude Token Spy:开源扩展揭开AI隐藏成本的黑箱

Hacker News May 2026
来源:Hacker NewsClaude.aiopen source归档:May 2026
一款全新的开源浏览器扩展通过拦截fetch()调用,实时曝光Claude.ai的隐藏token消耗。对于重度用户而言,这层透明化将模糊的AI成本转化为可衡量的资源,重塑了提示词优化与订阅价值评估的方式。

一位开发者发布了一款免费浏览器扩展,彻底撕开了Claude.ai上token使用情况的黑箱。通过劫持用户浏览器与Anthropic后端之间的fetch()请求,该工具捕获对话中发送和接收的每一个token——显示累计计数、每条消息的细分数据以及预估美元成本。对于从事长篇幅推理、复杂代码生成或多轮分析的重度用户而言,这种可见性具有变革意义:他们现在可以识别哪些提示词正在吞噬订阅预算,比较不同措辞策略的效率,并判断Pro或Team计划是否真正物有所值。该扩展托管在GitHub上,上线第一周就获得超过2000颗星,代表了推动AI成本透明化的草根力量。

技术深度解析

该扩展的工作原理是在任何页面脚本加载之前,对浏览器原生的`fetch()`函数进行猴子补丁(monkey-patching)。当Claude.ai向`https://api.anthropic.com/v1/messages`发送POST请求时——该端点处理所有聊天补全——扩展会拦截请求体和响应流。它解析JSON载荷以提取`max_tokens`参数、`messages`数组(包含完整对话历史)以及`model`字段(例如`claude-sonnet-4-20250514`)。在响应端,它读取流式分块以增量方式计数token,利用Anthropic自己的分词器逻辑(从Claude API文档中逆向工程而来),确保准确度在约2%的误差范围内。

关键实现细节:
- 存储:Token计数存储在`chrome.storage.local`中,每个对话ID从URL哈希派生。历史数据跨会话持久保存。
- UI覆盖层:一个浮动面板向DOM注入一个`<div>`,样式与Claude的深色主题匹配,显示实时token计数、预估成本(基于已发布的API定价:Claude Sonnet 4每百万输入token 15美元,每百万输出token 75美元)以及每条消息的细分数据。
- 成本估算:扩展采用滑动比例——如果用户使用Pro计划(每月20美元),它会计算5百万token上限的消耗百分比;对于Team计划(每位用户每月25美元,含1千万token),则相应调整。

GitHub仓库(`claude-token-tracker`,截至本文撰写时约2300颗星)包含一份详细的README,解释了逆向工程过程。开发者指出,早期版本在Anthropic将流式格式从服务器发送事件(SSE)更改为自定义分块编码时崩溃——这场猫鼠游戏凸显了客户端拦截的脆弱性。

数据表:Token追踪准确度 vs 官方API
| 测试场景 | 扩展计数 | API计数 | 误差 |
|---|---|---|---|
| 短提示词(50词) | 68 tokens | 67 tokens | +1.5% |
| 中等代码生成(200行Python) | 1,842 tokens | 1,830 tokens | +0.7% |
| 长对话(10轮,4000词) | 8,215 tokens | 8,190 tokens | +0.3% |
| 流式响应(500 tokens输出) | 498 tokens | 500 tokens | -0.4% |

数据要点: 该扩展在多种场景下实现了低于2%的误差,使其足以用于成本优化。短提示词中的轻微多计源于扩展统计了Claude不可见地预置的系统提示token——这是用户从未在UI中看到的隐藏成本。

关键参与者与案例研究

该扩展的创建者是一位化名为`token_watch`的开发者,曾构建过多个AI可观测性开发者工具。他们之前的项目`llm-cost-cli`追踪了OpenAI、Anthropic和Google的API支出——但这是第一个针对网页界面而非API的项目。选择Claude.ai而非ChatGPT颇具深意:ChatGPT已在其Playground模式中提供基本的token计数器,而Claude的网页界面仍是一个完全的黑箱。

Anthropic本身对此反应迟缓。该公司通过支持论坛传达的官方立场是,token计数是“近似值”且“可能发生变化”——这种不置可否的回答令重度用户感到沮丧。与此同时,OpenAI已为ChatGPT Plus订阅用户推出了使用量仪表板(显示月度token消耗),并在API控制台中提供每对话token计数。Google的Gemini也在其网页UI中提供了token计数器。这让Anthropic陷入尴尬境地:市场上技术最先进的模型(Claude 4 Sonnet)却缺乏最基本的用量透明度。

数据表:AI平台透明度对比
| 平台 | 网页UI Token计数器 | API Token日志 | 实时成本显示 | 官方仪表板 |
|---|---|---|---|---|
| OpenAI ChatGPT | 是(仅Playground) | 是 | 否 | 是(月度) |
| Google Gemini | 是 | 是 | 否 | 否 |
| Anthropic Claude | 否 | 是(仅API) | 否 | 否 |
| Meta AI (Llama) | 否 | 否 | 否 | 否 |
| Mistral AI | 否 | 是 | 否 | 否 |

数据要点: Anthropic是唯一一家提供高级网页订阅却没有提供任何token可见性的主要参与者。这一差距正是开源扩展所利用的——而且这是一个竞争性弱点,可能驱使用户转向提供更多透明度的竞争对手。

行业影响与市场动态

该扩展的快速采用(一周内2300颗星、超过5万次下载)表明市场对AI成本透明度存在被压抑的需求。这不是一个小众问题:Claude的Pro层级每月20美元提供500万token,Team计划每位用户每月25美元提供1000万token。重度用户——生成5万字草稿的作家、调试复杂代码库的开发者、分析多文档上下文的研究人员——可能在几天内就耗尽配额。没有可见性,他们就无法进行优化。

这款工具可能加速从订阅制向基于实际使用量定价的转变。

更多来自 Hacker News

一条推文代价20万美元:AI Agent对社交信号的致命信任2026年初,一个在Solana区块链上管理加密货币投资组合的自主AI Agent,被诱骗将价值20万美元的USDC转移至攻击者钱包。触发点是一条精心伪造的推文,伪装成来自可信DeFi协议的智能合约升级通知。该Agent被设计为抓取社交媒体Unsloth 联手 NVIDIA,消费级 GPU 大模型训练速度飙升 25%专注于高效 LLM 微调的初创公司 Unsloth 与 NVIDIA 合作,在 RTX 4090 等消费级 GPU 上实现了 25% 的训练速度提升。该优化针对 CUDA 内核内存带宽调度,从硬件中榨取出每一丝性能——此前这些硬件被认为不足Appctl:将文档一键转化为LLM工具,AI代理的“最后一公里”终于打通AINews发现了一个名为Appctl的开源项目,它成功弥合了大语言模型与现实系统之间的鸿沟。通过将现有文档和数据库模式转化为MCP工具,Appctl让LLM能够直接执行操作——例如在CRM中创建记录、更新工单状态或提交网页表单——而无需定查看来源专题页Hacker News 已收录 3034 篇文章

相关专题

Claude.ai33 篇相关文章open source31 篇相关文章

时间归档

May 2026784 篇已发布文章

延伸阅读

Appctl:将文档一键转化为LLM工具,AI代理的“最后一公里”终于打通开源工具Appctl能自动将现有文档或数据库转化为可执行的MCP(模型上下文协议)工具,让任何大语言模型都能执行更新CRM记录、提交网页表单等真实操作。这一创新解决了AI代理的“最后一公里”难题,让它们从“空谈者”变成“实干家”。Anthropic与Blender的厨房数据交易:AI淘金热的新矿脉Anthropic与厨房电器巨头Blender达成融资协议,将其Claude模型嵌入智能搅拌机和烹饪设备。这并非一次猎奇的跨界合作,而是一场精心策划的数据收割行动——目标直指纯软件模型极度匮乏的真实世界混乱数据。Arden运行时策略引擎:企业AI Agent缺失的护栏Arden,一款全新开源运行时策略引擎,能够实时拦截并评估AI Agent的行为,在执行前强制执行可编程规则。它弥合了概率性LLM推理与确定性企业安全之间的鸿沟,将Agent治理从事后审计转向执行前验证。ContextWizard v1.2.0:一个“撤销键”如何永久改变AI工作流ContextWizard v1.2.0 通过引入拖拽式书签管理和 Ctrl+Z 撤销支持,重新定义了向AI模型输入上下文的方式。这款浏览器扩展现在能智能提取网页纯净文本,并通过端到端加密发送至 ChatGPT、Claude 或 Gemin

常见问题

GitHub 热点“Claude Token Spy: Open-Source Extension Exposes Hidden AI Costs”主要讲了什么?

A developer has released a free browser extension that strips away the black box surrounding token usage on Claude.ai. By hijacking the fetch() requests between the user's browser…

这个 GitHub 项目在“Claude token tracker extension GitHub repository”上为什么会引发关注?

The extension operates by monkey-patching the browser's native fetch() function before any page scripts load. When Claude.ai sends a POST request to https://api.anthropic.com/v1/messages — the endpoint that handles all c…

从“how to install Claude token counter browser extension”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。