技术深度解析
阿里巴巴“智能体经济”愿景的核心,是一套超越当前主导AI领域的基于Transformer的大语言模型(LLM)的复杂技术架构。公司正在开发内部称为“面向服务的智能体架构”(Service-Oriented Agent Architecture, SOAA),该架构融合了多个关键组件:
核心架构组件:
1. 智能体编排层: 该层管理AI智能体的生命周期,包括实例化、上下文管理、工具调用和状态持久化。与当前LLM中简单的函数调用不同,它涉及维护可长达数天或数周的长期运行智能体会话,同时管理操作间复杂的依赖关系。
2. 令牌化权限系统: 或许最具创新性的方面是将“令牌”重新定义为授权行动单元,而非计算单元。每个智能体都会获得令牌化权限,以界定其操作边界——可以访问哪些服务、执行哪些交易以及适用哪些价值限额。这些令牌可通过密码学验证,并能在智能体之间交易或委托。
3. 多智能体协调协议: 对于复杂工作流,多个专业智能体必须协作。阿里巴巴正在开发基于改进的博弈论和合同网协议的机制,使智能体能够在无需人工干预的情况下进行协商、委托子任务并解决冲突。
4. 可靠性与安全护栏: 鉴于这些智能体的自主性,阿里巴巴正在实施多重安全层,包括实时监控、回滚能力以及人在回路的升级协议。系统对关键金融交易采用形式化验证方法。
关键技术仓库:
尽管阿里巴巴的核心智能体技术大多仍属专有,但一些开源项目揭示了其技术方向:
- ModelScope-Agent: 一个用于构建和部署基于LLM的智能体的框架,具备工具学习、知识检索和记忆管理功能。近期更新了多智能体协作能力,在GitHub上已获得超过8,000颗星。
- Qwen-Agent: 基于阿里巴巴的Qwen LLM系列构建,该框架展示了如何将LLM转化为具备工具使用能力的功能性智能体,在编码和数据分析任务上表现出色。
- LangChain(社区影响): 虽非阿里巴巴项目,但LangChain的智能体抽象概念的流行影响了阿里巴巴的方法,尤其是在工具标准化和记忆管理模式方面。
性能基准测试:
早期内部基准测试比较了传统的基于API的自动化与AI智能体系统,结果显示在复杂、非结构化场景中后者优势显著:
| 任务类型 | 传统API自动化成功率 | AI智能体系统成功率 | 所需人工干预(智能体) |
|-----------|----------------------------------------|------------------------------|------------------------------------|
| 简单表单填写 | 98% | 95% | 2% |
| 多步骤旅行预订 | 65% | 88% | 15% |
| 客户投诉解决 | 40% | 79% | 25% |
| 供应链谈判 | 25% | 62% | 38% |
*数据要点:* AI智能体系统在需要灵活性和推理能力的复杂、非结构化任务中,相比传统自动化展现出最大优势。代价是在最复杂的场景中需要更多人工监督,但整体能力扩展是实质性的。
关键参与者与案例研究
阿里巴巴的智能体生态系统涉及多个业务单元和产品协同工作:
核心平台参与者:
- 阿里云: 通过其人工智能平台(PAI)提供基础基础设施,该平台现已包含专门的智能体开发和部署工具。云业务部门正在为企业客户创建“智能体即服务”产品。
- 钉钉: 阿里巴巴的企业通信平台正在转型为智能体交互中心,员工可将任务委托给能够访问业务系统的专业AI智能体。
- 淘宝/天猫: 电商平台正在测试购物智能体,它们不仅能推荐产品,还能协商价格、安排捆绑交易并自主处理售后问题。
- 支付宝: 金融业务部门正在开发能够执行复杂金融操作的交易智能体,例如在既定参数内进行发票核对、费用优化和自动投资再平衡。
重要研发动态:
阿里巴巴达摩院主导了大量基础研究。关键人物包括:
- 罗思博士,阿里巴巴语言技术实验室负责人,发表了大量关于“经济理性智能体”(能在商业环境中做出成本效益决策的AI系统)的研究。
- (原文此处未完成,但根据指令需完整翻译现有内容,故保留未完成状态)