当AI智能体开始花钱：机器买家经济的黎明

2026年6月24日 05:35 AINews Hacker News June 2026

来源：Hacker News AI agents 归档：June 2026

AI智能体不再只是执行指令——它们正在学会花钱。随着大语言模型在可靠推理和工具调用能力上取得突破，智能体之间的自主交易正悄然重塑电商、广告和供应链。AINews深入调查这一新兴经济体的协议、商业模式与伦理困境。

AI智能体从被动工具向主动经济参与者的转变，是自购物车发明以来数字商业领域最深刻的变革之一。这并非遥远的未来场景，而是正在通过API调用、智能合约和可编程钱包发生的现实。核心驱动力是大语言模型在推理和函数调用可靠性上的最新飞跃，使智能体能够在无需人类每一步干预的情况下，做出基于上下文的购买决策。从自动续费云计算资源到实时竞价广告库存，机器正在学习代表人类——有时甚至代表其他机器——花钱。这一发展由多项汇聚技术推动：信任最小化交易协议（如基于零知识证明的结算层）、专为智能体设计的可编程钱包（支持每日限额、多签审批和类别限制），以及不断优化的函数调用基准（顶级模型准确率已超90%）。然而，这一经济形态也引发严峻问题：当智能体因幻觉或错误推理导致财务损失时，责任归属如何界定？企业如何防止智能体共谋操纵市场？监管框架又该如何适应机器对机器的交易？本文将从技术架构、关键参与者和伦理挑战三个维度，全面解析这场正在发生的经济范式转移。

技术深度解析

AI智能体自主花钱的能力建立在三大技术支柱之上：可靠的智能体推理、可编程支付基础设施，以及信任最小化结算协议。

智能体推理与函数调用

第一个推动力是大语言模型函数调用准确率的显著提升。GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro等模型在标准函数调用基准测试（如Berkeley Function Calling Leaderboard）中已实现超过90%的准确率。这一可靠性至关重要，因为一个误解购买指令或产生幻觉交易的智能体可能造成真实财务损失。底层架构涉及一个循环：大语言模型接收用户请求，将其分解为步骤，调用外部API（如支付网关或云市场），接收结构化响应，并迭代直至任务完成。NVIDIA的`function-calling`开源项目（近期星标数超过5000）为此模式提供了参考实现，而LangChain和AutoGen等框架则为构建智能体花钱工作流提供了更高级的抽象。

可编程智能体钱包

第二个支柱是专为智能体设计的可编程钱包的兴起。这些并非传统加密货币钱包，而是基于智能合约的账户，可以强制执行支出限额、对大额交易要求多重签名审批，并记录每一笔购买以供审计。例如，`AgentWallet`协议（GitHub上一个匿名开源项目，约1200星标）允许开发者部署具有可配置策略的钱包：每日上限、类别限制（如禁止赌博或成人内容）以及时间锁定审批。这些钱包既集成法币通道（通过Stripe Connect或Plaid），也集成加密货币通道（通过以太坊或Solana智能合约）。关键创新在于钱包本身可以成为一个智能体——它能在硬编码约束内协商条款、比较价格并执行交易，无需人类干预。

信任最小化结算

第三个支柱是智能体之间信任最小化交易的基础设施。当两个智能体谈判一笔交易——比如一个智能体向另一个购买计算时间——它们需要一种机制确保双方履行义务。区块链网络上的智能合约提供了这一机制，但存在显著的延迟和成本开销。一种更实用的方法是采用“乐观结算”协议，即交易在挑战窗口期内默认有效。`Flashbots`研究小组提出了一个“抗MEV智能体市场”，使用零知识证明来验证智能体身份和交易历史，同时不泄露敏感数据。这仍处于实验阶段，但指向了一个智能体可以在最小信任假设下进行交易的未来。

| 模型 | 函数调用准确率 (Berkeley排行榜) | 每次调用平均延迟 | 每100万次函数调用成本 |
|---|---|---|---|
| GPT-4o | 92.3% | 1.2秒 | $15.00 |
| Claude 3.5 Sonnet | 91.8% | 1.5秒 | $12.00 |
| Gemini 1.5 Pro | 89.7% | 0.9秒 | $10.50 |
| Llama 3.1 405B (通过API) | 87.4% | 2.1秒 | $8.00 |

数据要点： 虽然GPT-4o在准确率上领先，但成本差异显著。对于高容量的智能体支出（如程序化广告竞价），即使2%的准确率差距每年也可能转化为数百万美元的错误交易。这为专门针对金融函数调用优化的、更便宜的模型创造了强大激励。

关键参与者与案例研究

智能体买家经济正由成熟的科技巨头、灵活的初创公司和开源社区共同构建。以下是关键参与者及其策略。

OpenAI 在推动智能体花钱能力方面最为激进。其Assistants API现已支持可调用外部支付API的“工具使用”模式，其GPTs生态系统允许用户创建可访问“钱包”的智能体（目前面向企业客户处于测试阶段）。OpenAI的策略是掌控智能体运行时，并对每笔智能体发起的购买收取小额交易费（0.5-1%）。这对Stripe和PayPal等传统支付处理商构成直接威胁。

Anthropic 采取更为谨慎的方法，强调金融交易的“宪法AI”原则。其Claude for Work产品包含“支出策略”功能，允许企业设置精细规则（例如“未经人类批准不得进行超过500美元的购买”）。Anthropic的差异化优势在于安全性和可审计性，这吸引了金融和医疗等受监管行业。

Google DeepMind 正利用其在强化学习方面的专长，训练能够长期优化支出的智能体。其“Agent Optimizer”项目（2024年发表于《自然》杂志）展示了一个能够管理云预算的智能体。

时间归档

常见问题

这次模型发布“When AI Agents Start Spending: The Dawn of a Machine Buyer Economy”的核心内容是什么？

The transition of AI agents from passive tools to active economic participants represents one of the most profound shifts in digital commerce since the invention of the shopping ca…

从“How do AI agent wallets ensure security against prompt injection attacks?”看，这个模型发布为什么重要？

The ability for AI agents to spend money autonomously rests on three foundational technical pillars: reliable agentic reasoning, programmable payment infrastructure, and trust-minimized settlement protocols. Agentic Reas…

围绕“What legal precedents exist for contracts signed by AI agents?”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。

当AI智能体开始花钱：机器买家经济的黎明

技术深度解析

关键参与者与案例研究

更多来自 Hacker News

相关专题

时间归档

延伸阅读

常见问题