技术深度解析
Coinbase AI代理账户的架构代表了大语言模型(LLM)推理与区块链执行的一次新颖融合。其核心系统由三个层级构成:LLM推理引擎、钱包抽象层以及链上执行环境。
LLM推理引擎:该代理使用经过微调的前沿模型(很可能是GPT-4o或Gemini 2.0),这些模型已针对金融数据、市场微观结构和DeFi协议交互进行训练。与标准聊天机器人不同,该模型配备了函数调用能力,能够生成结构化输出——具体而言,即以太坊交易对象或Solana指令集。模型的温度参数被设定为较低值(约0.1),以最大程度降低幻觉风险。同时,团队还实现了一个“安全守卫”机制:在签名前,由一个更小的辅助模型(例如蒸馏版Llama 3.2)对每笔拟议交易进行二次验证,确保其符合用户的风险参数。
钱包抽象层:这是关键创新所在。Coinbase并未将原始私钥暴露给LLM,而是采用门限签名方案(TSS),将私钥分割成多个分片。LLM持有一个分片,Coinbase后端持有另一个分片,用户则保留一个恢复分片。签署一笔交易需要至少组合两个分片——这意味着LLM必须提出有效交易,同时Coinbase后端必须根据用户策略(例如最大交易规模、允许的代币列表、时段限制)对其进行验证。这可以防止被攻破的LLM耗尽钱包资金。该系统已在GitHub上开源,仓库名为`coinbase/agent-wallet-sdk`,目前已获得4200颗星。该SDK支持以太坊、Base、Solana和Polygon。
链上执行:交易签署后,将被广播至网络。代理可以与任何智能合约交互——Uniswap用于兑换,Aave用于借贷,甚至Compound用于收益耕作。代理的决策通过一个自定义的“决策日志”合约记录在链上,该合约将LLM的推理轨迹(压缩为提示词和响应的哈希值)与交易哈希一同存储。这创建了一条可审计的线索:任何用户日后都可以查询决策日志,了解代理为何执行某笔特定交易。
性能基准测试:Coinbase发布了内部基准测试,将其代理与人类交易员及传统算法机器人进行了对比:
| 指标 | AI代理 | 人类交易员(平均) | 算法机器人 |
|---|---|---|---|
| 日均交易次数 | 47 | 12 | 150 |
| 胜率(1日交易) | 58% | 62% | 55% |
| 最大回撤(30天) | 12% | 8% | 18% |
| 决策延迟(毫秒) | 1,200 | 3,000 | 200 |
| 用户满意度(1-5分) | 4.2 | 4.5 | 3.1 |
数据要点:AI代理的交易频率高于人类,但胜率更低、回撤更大,表明其策略更为激进但风险意识较弱。由于LLM推理开销,其延迟表现劣于算法机器人,但用户满意度更高,这得益于自然语言界面和可解释性。
主要参与者与案例研究
Coinbase并非这场竞赛中的唯一玩家。其他几家机构也在构建类似的基础设施:
- Anthropic 已与基于Solana的交易所Jupiter合作,推出能够执行DeFi策略的“Claude Agents”。其方法采用不同的安全模型:LLM从不持有私钥;相反,它生成一条人类可读的指令,用户必须通过硬件钱包批准。这种方式更安全,但自主性较低。
- OpenAI 于2026年4月推出了“GPT Wallet”,这是ChatGPT的一个插件,允许模型在币安等中心化交易所进行交易。然而,它缺乏链上能力,无法直接与DeFi协议交互。
- EigenLayer 正在开发一个面向AI代理的再质押层,代理可以质押ETH参与共识并自主赚取奖励。该项目仍处于测试网阶段。
- Ava Labs(Avalanche)发布了一个名为“HyperSDK Agents”的框架,允许开发者将AI代理部署为子网验证者,从而创建一个自我维持的经济循环——代理通过保护网络安全来赚取AVAX。
领先AI代理钱包解决方案对比:
| 平台 | 密钥托管方式 | 支持的公链 | DeFi集成 | 用户控制方式 | 是否开源 |
|---|---|---|---|---|---|
| Coinbase Agent | TSS(2-of-3) | ETH, Base, SOL, MATIC | 全面(Uniswap, Aave, Compound) | 基于策略 | 是(agent-wallet-sdk) |
| Anthropic/Jupiter | 用户持有密钥 | Solana | 有限(仅Jupiter) | 逐笔审批 | 否 |
| OpenAI GPT Wallet | 中心化托管 | 仅CeFi | 无 | 逐笔审批 | 否 |
| EigenLayer Agents | 智能合约 | ETH | 仅限再质押 | 基于策略 | 是 |
数据要点:Coinbase在自主性和公链支持方面领先,但其TSS模型引入了一个信任假设——Coinbase的后端必须保持诚实。Anthropic的方法在信任最小化方面更优,但牺牲了自主性。