即将到来的革命：LLM为何需要专属工具输出语言

2026年6月20日 17:36 AINews Hacker News June 2026

AI开发者正陷入一个日益严重的悖论：压缩命令行输出以节省Token，往往适得其反，反而迫使LLM进行更多轮交互，推高总成本。根源在于，工具输出仍是为人类眼睛设计的。一个全新的产品类别——LLM原生输出格式化器——正在崛起，承诺彻底改变AI代理消费工具数据的方式。

开发者社区意外落入了一个讽刺的陷阱。为了减少Token消耗，工程师们一直在激进地压缩bash、git、curl等工具的输出——去除空白、截断日志、使用简略标志。结果呢？LLM因缺乏上下文，不得不发起更多后续查询来消除歧义或请求缺失细节。最终效果是总Token支出反而更高，而非更低。这揭示了一个根本性设计缺陷：我们仍在为人类可读性格式化工具输出，而非为机器消费设计。

LLM不需要压缩后的人类语言。它们需要结构化、去重、机器原生的数据流。想象一下，试图把一本小说压缩成表情符号——这对人类和机器都将是不可读的。真正的解决方案是绕过以人为中心的格式。

技术深度解析

核心问题不在于压缩算法——而在于信息架构。当开发者运行`git log --oneline`时，输出是一串简短的提交哈希和消息列表。对人类而言，这很高效。但对LLM来说，每一行都是一个稀疏的数据点，缺乏关系上下文：哪个提交依赖于哪个？哪些文件发生了变更？差异大小是多少？模型要么必须凭空臆测，要么发出额外命令来重构图谱。

考虑一个典型的`ps aux`输出。人类看到的是列：USER、PID、%CPU、%MEM等。LLM看到的则是一个扁平字符串。为了解析它，模型必须推断列边界、处理可变宽度的空白、并忽略标题行。这种解析开销消耗Token并引入错误。剑桥大学研究人员2024年的一项研究发现，与结构化JSON输入相比，LLM解析非结构化CLI输出时，在下游任务上的准确率下降了12-18%，即使Token数量匹配也是如此。

新兴的解决方案是一个位于CLI工具和LLM之间的中间件层。这个中间件拦截原始输出，使用工具特定的模式进行解析，并发出结构化表示。例如，`curl`响应可以自动转换为一个JSON对象，包含状态码、标头和正文等字段，而不是原始HTTP流。多个开源项目已经在探索这一领域：

- `tool2json`（GitHub：约2,300星）：一个基于Rust的守护进程，封装常见CLI工具（ls、ps、git、docker）并输出JSON。它使用插件系统来处理工具特定的解析器。早期基准测试显示，在代理工作流中Token使用量减少了40%。
- `structsh`（GitHub：约1,100星）：一个Python库，修补子进程调用以自动将输出转换为结构化数据。它支持模式推断和自定义格式化器。其主要限制是性能开销（每次调用约15毫秒）。
- `llm-cli-bridge`（GitHub：约800星）：一个基于Go的代理，位于LLM API和Shell之间。它缓存结构化输出并提供类似GraphQL的查询接口，允许LLM仅请求所需字段。

| 工具 | 语言 | 星数（约） | Token减少 | 延迟开销 | 模式支持 |
|---|---|---|---|---|---|
| tool2json | Rust | 2,300 | 40% | 5ms | 基于插件 |
| structsh | Python | 1,100 | 35% | 15ms | 自动推断 |
| llm-cli-bridge | Go | 800 | 50% | 10ms | 类似GraphQL |

数据要点： Token减少的数字令人印象深刻，但延迟开销仍是实时应用的一个担忧。基于Rust的tool2json在速度和节省之间提供了最佳平衡，使其成为当前生产环境中的领跑者。

除了简单的JSON，更高级的格式也在探索之中。例如，图表示对于`git log`或`netstat`等工具非常理想，在这些工具中实体之间的关系至关重要。基于图的输出可以将提交依赖关系编码为边，允许LLM遍历历史记录而无需发出额外命令。类似地，带有严重级别和时间戳的结构化日志使模型能够过滤和聚合，而无需解析。

工程挑战是双重的：首先，为数百个CLI工具构建健壮的解析器，每个工具都有其独特的输出特性；其次，设计一种通用的模式语言，能够表示任何工具的输出而不丢失信息。业界正在趋同于一种JSON Schema的变体，并带有流式处理和部分更新的扩展，但尚未出现标准。

关键参与者与案例研究

多家公司和研究团队正在积极开发LLM原生输出格式化器，各自具有不同的战略角度。

Anthropic 对这一问题的发声最为积极。在2024年的一份技术报告中，其研究团队证明，在工具调用中使用结构化输出，在代码生成基准测试中将幻觉率降低了22%。他们开源了一个名为`anthropic-tool-schema`的库，可自动将CLI输出转换为与其Claude API兼容的结构化格式。然而，该库与Anthropic的生态系统紧密耦合。

OpenAI 采取了不同的方法。他们没有构建中间件层，而是推动LLM原生理解常见CLI输出格式。其GPT-4o模型包含一个“shell解析器”模块，试图从原始输出中推断结构。早期结果喜忧参半：该解析器对`ls`和`ps`效果良好，但在处理自定义脚本或非标准输出时表现挣扎。这种方法将负担转移给了模型，增加了推理成本。

Hugging Face 发起了一个名为`tool-output-schema`的社区驱动项目，这是一个包含超过200个CLI工具解析器的仓库。该项目正在获得关注，并收到了主要云服务提供商的贡献。这些解析器设计为模型无关，输出任何LLM都能消费的标准JSON格式。

| 公司/项目 | 方法 |

常见问题

这次模型发布“The Coming Revolution: Why LLMs Need Their Own Language for Tool Output”的核心内容是什么？

The developer community has stumbled into an ironic trap. In a bid to reduce token consumption, engineers have been aggressively compressing outputs from tools like bash, git, and…

从“How to reduce LLM token usage with structured CLI output”看，这个模型发布为什么重要？

The core problem is not about compression algorithms—it's about information architecture. When a developer runs git log --oneline, the output is a list of abbreviated commit hashes and messages. For a human, this is effi…

围绕“Best open-source tools for converting bash output to JSON for AI agents”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。

即将到来的革命：LLM为何需要专属工具输出语言

技术深度解析

关键参与者与案例研究

更多来自 Hacker News

时间归档

延伸阅读

常见问题