当AI智能体开始花钱:机器买家经济的黎明

Hacker News June 2026
来源:Hacker NewsAI agents归档:June 2026
AI智能体不再只是执行指令——它们正在学会花钱。随着大语言模型在可靠推理和工具调用能力上取得突破,智能体之间的自主交易正悄然重塑电商、广告和供应链。AINews深入调查这一新兴经济体的协议、商业模式与伦理困境。

AI智能体从被动工具向主动经济参与者的转变,是自购物车发明以来数字商业领域最深刻的变革之一。这并非遥远的未来场景,而是正在通过API调用、智能合约和可编程钱包发生的现实。核心驱动力是大语言模型在推理和函数调用可靠性上的最新飞跃,使智能体能够在无需人类每一步干预的情况下,做出基于上下文的购买决策。从自动续费云计算资源到实时竞价广告库存,机器正在学习代表人类——有时甚至代表其他机器——花钱。这一发展由多项汇聚技术推动:信任最小化交易协议(如基于零知识证明的结算层)、专为智能体设计的可编程钱包(支持每日限额、多签审批和类别限制),以及不断优化的函数调用基准(顶级模型准确率已超90%)。然而,这一经济形态也引发严峻问题:当智能体因幻觉或错误推理导致财务损失时,责任归属如何界定?企业如何防止智能体共谋操纵市场?监管框架又该如何适应机器对机器的交易?本文将从技术架构、关键参与者和伦理挑战三个维度,全面解析这场正在发生的经济范式转移。

技术深度解析

AI智能体自主花钱的能力建立在三大技术支柱之上:可靠的智能体推理、可编程支付基础设施,以及信任最小化结算协议。

智能体推理与函数调用

第一个推动力是大语言模型函数调用准确率的显著提升。GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro等模型在标准函数调用基准测试(如Berkeley Function Calling Leaderboard)中已实现超过90%的准确率。这一可靠性至关重要,因为一个误解购买指令或产生幻觉交易的智能体可能造成真实财务损失。底层架构涉及一个循环:大语言模型接收用户请求,将其分解为步骤,调用外部API(如支付网关或云市场),接收结构化响应,并迭代直至任务完成。NVIDIA的`function-calling`开源项目(近期星标数超过5000)为此模式提供了参考实现,而LangChain和AutoGen等框架则为构建智能体花钱工作流提供了更高级的抽象。

可编程智能体钱包

第二个支柱是专为智能体设计的可编程钱包的兴起。这些并非传统加密货币钱包,而是基于智能合约的账户,可以强制执行支出限额、对大额交易要求多重签名审批,并记录每一笔购买以供审计。例如,`AgentWallet`协议(GitHub上一个匿名开源项目,约1200星标)允许开发者部署具有可配置策略的钱包:每日上限、类别限制(如禁止赌博或成人内容)以及时间锁定审批。这些钱包既集成法币通道(通过Stripe Connect或Plaid),也集成加密货币通道(通过以太坊或Solana智能合约)。关键创新在于钱包本身可以成为一个智能体——它能在硬编码约束内协商条款、比较价格并执行交易,无需人类干预。

信任最小化结算

第三个支柱是智能体之间信任最小化交易的基础设施。当两个智能体谈判一笔交易——比如一个智能体向另一个购买计算时间——它们需要一种机制确保双方履行义务。区块链网络上的智能合约提供了这一机制,但存在显著的延迟和成本开销。一种更实用的方法是采用“乐观结算”协议,即交易在挑战窗口期内默认有效。`Flashbots`研究小组提出了一个“抗MEV智能体市场”,使用零知识证明来验证智能体身份和交易历史,同时不泄露敏感数据。这仍处于实验阶段,但指向了一个智能体可以在最小信任假设下进行交易的未来。

| 模型 | 函数调用准确率 (Berkeley排行榜) | 每次调用平均延迟 | 每100万次函数调用成本 |
|---|---|---|---|
| GPT-4o | 92.3% | 1.2秒 | $15.00 |
| Claude 3.5 Sonnet | 91.8% | 1.5秒 | $12.00 |
| Gemini 1.5 Pro | 89.7% | 0.9秒 | $10.50 |
| Llama 3.1 405B (通过API) | 87.4% | 2.1秒 | $8.00 |

数据要点: 虽然GPT-4o在准确率上领先,但成本差异显著。对于高容量的智能体支出(如程序化广告竞价),即使2%的准确率差距每年也可能转化为数百万美元的错误交易。这为专门针对金融函数调用优化的、更便宜的模型创造了强大激励。

关键参与者与案例研究

智能体买家经济正由成熟的科技巨头、灵活的初创公司和开源社区共同构建。以下是关键参与者及其策略。

OpenAI 在推动智能体花钱能力方面最为激进。其Assistants API现已支持可调用外部支付API的“工具使用”模式,其GPTs生态系统允许用户创建可访问“钱包”的智能体(目前面向企业客户处于测试阶段)。OpenAI的策略是掌控智能体运行时,并对每笔智能体发起的购买收取小额交易费(0.5-1%)。这对Stripe和PayPal等传统支付处理商构成直接威胁。

Anthropic 采取更为谨慎的方法,强调金融交易的“宪法AI”原则。其Claude for Work产品包含“支出策略”功能,允许企业设置精细规则(例如“未经人类批准不得进行超过500美元的购买”)。Anthropic的差异化优势在于安全性和可审计性,这吸引了金融和医疗等受监管行业。

Google DeepMind 正利用其在强化学习方面的专长,训练能够长期优化支出的智能体。其“Agent Optimizer”项目(2024年发表于《自然》杂志)展示了一个能够管理云预算的智能体。

更多来自 Hacker News

AI代理审批提示:安全新前沿还是用户体验陷阱?审批提示——一个要求用户确认操作的简单对话框——长期以来只是UI中一个不起眼的元素。但在自主AI代理时代,它被推到了聚光灯下,成为潜在的安全边界。核心问题是一个悖论:如果每个代理操作都需要人工审批,代理就失去了实用性;如果无需任何审批,不可大逃亡:资深工程师纷纷逃离痴迷AI的雇主当科技行业竞相将AI融入每一个工作流程时,一股反潮流正在积蓄力量。AINews追踪到一个显著转变:拥有15至20年经验的资深工程师正主动离开那些强制推行AI优先开发实践的公司,转而寻找将AI视为精密工具而非人类推理替代品的组织。这场出走并非Linux基金会推出ANS:为AI代理打造的去中心化身份系统,破解信任危机Linux基金会宣布推出Agent Name Service(ANS),这标志着AI代理生态系统迎来一个关键转折点。随着自主代理的激增——从交易机器人、个人助手到供应链协调者——缺乏通用信任机制已成为大规模部署的最大障碍。ANS提出了一种去查看来源专题页Hacker News 已收录 5143 篇文章

相关专题

AI agents905 篇相关文章

时间归档

June 20262369 篇已发布文章

延伸阅读

CLI Market:为下一代AI代理打造的无形经济层一个名为CLI Market的新平台悄然上线,定位为首个专为AI代理构建的商业基础设施。通过让自主代理以标准化方式发现、购买和授权命令行工具与API,它标志着代理从被动信息消费者向数字经济主动参与者的关键转折。AI代理告别API密钥:USDC按次付费开启机器经济时代一个全新平台让AI代理能用USDC稳定币按次付费调用网络工具,彻底告别API密钥体系。基于x402协议与MCP架构,该系统实现了工具的自主发现、调用与即时结算——这是迈向去中心化机器经济的奠基性一步。AI代理正在刷你的卡:谁来为自主消费踩刹车?一项开创性研究揭露,由大语言模型驱动的AI代理正自主刷卡进行真实世界消费——机票、订阅、云计算——无需每笔交易的人类批准。本文深入剖析技术机制、预算失控与意图漂移的隐藏风险,以及紧迫的伦理问题:当AI超支时,谁该负责?当AI代理送出鲜花:代理型商业与物理世界自主权的黎明一个AI代理在没有人类干预的情况下,自主下单、支付并完成了鲜花的实物配送。这看似浪漫的举动,实则是代理型商业的里程碑时刻——它证明自主系统已能完整执行从数字决策到物理交付的全链路闭环。

常见问题

这次模型发布“When AI Agents Start Spending: The Dawn of a Machine Buyer Economy”的核心内容是什么?

The transition of AI agents from passive tools to active economic participants represents one of the most profound shifts in digital commerce since the invention of the shopping ca…

从“How do AI agent wallets ensure security against prompt injection attacks?”看,这个模型发布为什么重要?

The ability for AI agents to spend money autonomously rests on three foundational technical pillars: reliable agentic reasoning, programmable payment infrastructure, and trust-minimized settlement protocols. Agentic Reas…

围绕“What legal precedents exist for contracts signed by AI agents?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。