AI代理行为守则：运行时治理成为下一个前沿战场

Q: 围绕“Open Policy Agent vs Deontic-Agent for AI governance”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。

AI代理作为自主数字员工的时代已经到来。这些代理可以配置云资源、执行SQL查询、签署API合同，甚至跨组织边界与其他代理谈判。但权力越大，治理风险也前所未有地高。静态访问控制列表（ACL）和基于角色的访问控制（RBAC）是为在可预测会话中操作的人类用户设计的，而非为能在数秒内链式调用数百次工具调用、且每次调用都可能升级权限的代理。

道义运行时治理应运而生——这一框架借鉴法律哲学，将代理在每个决策点上可以、禁止和必须做什么形式化。该方法不是在登录时一次性检查权限，而是在每次工具调用时评估行动。其核心是用三态逻辑取代二元的“允许/拒绝”模型：允许（may）、禁止（must not）和强制（must）。这模仿了法律体系和伦理学中使用的道义模态，但针对机器执行进行了适配。

架构上，该框架作为中间件层位于代理的推理引擎（如GPT-4、Claude或开源模型）与它调用的外部工具之间。每次工具调用都通过一个策略决策点（PDP），该点根据一组用Rego（来自Open Policy Agent）或自定义DSL等声明性语言编写的策略来评估行动。典型流程包括：代理生成计划、每一步被PDP拦截、PDP检查权限、执行或阻止行动，并将所有决策记录在不可篡改的审计日志中。

关键工程方法包括：策略即代码（策略可版本控制、可测试、可通过CI/CD管道部署）、上下文感知评估（策略可考虑行动、代理身份、数据敏感性、时间、先前行动次数甚至代理置信度分数）、以及前置与后置钩子（强制行动可在工具调用前后执行）。开源参考实现如Deontic-Agent（1.2k星）和Guardrails-AI（4.5k星）提供了工作示例。性能基准测试显示，OPA+Rego方案在延迟（2-5毫秒）和吞吐量（200-500次/秒）之间取得了最佳平衡。

初创公司如Axiom Security（获1500万美元A轮融资）和Veritas AI（专注金融领域）正在引领商业化。微软和谷歌云等企业巨头也已将类似道义的策略集成到其平台中。

技术深度解析

道义运行时治理的核心，是用三态逻辑取代二元的“允许/拒绝”模型：允许（may）、禁止（must not）和强制（must）。这模仿了法律体系和伦理学中使用的道义模态，但针对机器执行进行了适配。

架构

该框架作为中间件层，位于代理的推理引擎（例如GPT-4、Claude或开源模型）与它调用的外部工具之间。每次工具调用都通过一个策略决策点（PDP），该点根据一组用声明性语言（如Open Policy Agent的Rego或自定义DSL）编写的策略来评估行动。

典型流程：
1. 代理生成计划：“从数据库读取用户数据，然后向营销团队发送邮件。”
2. 每一步都被PDP拦截。
3. PDP检查：读取用户数据是否被允许？目标数据库是否在范围内？邮件收件人是否被授权？
4. 如果允许，行动继续；如果禁止，行动被阻止；如果是强制性的（例如必须记录该行动），PDP在行动之前或之后强制执行。
5. 所有决策都记录在不可篡改的审计日志中。

关键工程方法

- 策略即代码：策略可版本控制、可测试、可通过CI/CD管道部署。这使得治理团队无需重新部署代理即可更新规则。
- 上下文感知评估：策略不仅可考虑行动本身，还可考虑代理身份、数据敏感性、一天中的时间、先前行动次数，甚至代理的置信度分数。
- 前置与后置钩子：强制行动可在工具调用之前（例如发送前必须加密数据）或之后（例如必须记录该行动）执行。

开源参考

Deontic-Agent GitHub仓库（github.com/deontic-agent/deontic-agent，1.2k星）提供了一个使用LangChain和OPA的工作实现。它包括常见场景的策略模板：数据泄露预防、权限升级检测和跨代理协调限制。另一个项目Guardrails-AI（github.com/guardrails-ai/guardrails，4.5k星）提供了一种补充方法，通过验证代理输出是否符合结构和语义约束。

性能基准测试

| 框架 | 每次决策延迟 | 吞吐量（决策/秒） | 策略复杂度 | 审计粒度 |
|---|---|---|---|---|
| OPA + Rego | 2-5毫秒 | 200-500 | 高 | 完整追踪 |
| Deontic-Agent | 8-15毫秒 | 60-125 | 中 | 完整追踪 |
| Guardrails-AI | 10-20毫秒 | 50-100 | 低 | 仅输出 |
| 自定义RBAC | <1毫秒 | 1000+ | 低 | 最小 |

数据要点： 虽然自定义RBAC速度最快，但它缺乏处理道义模态的表达能力。基于OPA的解决方案在生产部署中提供了性能与策略丰富性的最佳平衡，延迟低于10毫秒——对于大多数实时代理交互来说是可以接受的。

关键玩家与案例研究

引领潮流的初创公司

总部位于帕洛阿尔托的初创公司'Axiom Security'（不要与数据平台混淆）构建了一个专门针对AI代理的商业化运行时治理平台。其产品'Axiom Guard'集成了主要代理框架（LangChain、AutoGPT、CrewAI），并提供了策略管理、实时监控和审计导出的仪表板。他们最近获得了由Sequoia领投的1500万美元A轮融资。

总部位于伦敦的'Veritas AI'专注于金融领域。其系统强制执行“必须”规则——例如，处理交易的代理必须首先检查客户的风险状况，必须将交易记录到交易所，并且不得超过头寸限制。他们声称，在与两家欧洲银行的试点项目中，合规事件减少了40%。

企业巨头

微软已将其类似道义的策略集成到Dynamics 365的Copilot Studio中。其“数据安全与合规”模块允许管理员为代理对客户数据的操作定义“可以”、“禁止”和“必须”规则。然而，它目前仅限于微软生态系统。

谷歌云为Vertex AI代理提供了“代理策略管理器”（测试版）。它使用一种类似于Rego但针对谷歌基础设施优化的策略语言。早期采用者包括一家医疗保健提供商，该提供商使用它来强制执行HIPAA约束，用于一个安排预约和访问医疗记录的代理。

对比表格

| 供应商 | 产品 | 策略语言 | 支持的代理框架 | 行业重点 | 定价模式 |
|---|---|---|---|---|---|
| Axiom Security | Axiom Guard | 基于Rego的DSL | LangChain, AutoGPT, CrewAI, 自定义 | 通用企业 | 按代理/月 |
| Veritas AI | Veritas Compliance Engine | 专有DSL | LangChain, 自定义 | 金融、医疗 | 按策略/月 |
| 微软 | Copilot Studio D&S | 可视化 + YAML | 仅Microsoft Copilot | 通用 | 包含在E5中 |
| 谷歌云 | Agent Policy Manager | 类Rego | Vertex AI代理 | 通用 | 按请求 |
| 开源 | Deontic-Agent | Rego | LangChain, 自定义 | 通用 | 免费 |

时间归档

延伸阅读

常见问题

这次模型发布“The AI Agent Code of Conduct: Why Runtime Governance Is the Next Frontier”的核心内容是什么？

The era of AI agents acting as autonomous digital employees has arrived. These agents can provision cloud resources, execute SQL queries, sign API contracts, and even negotiate wit…

从“How deontic logic prevents AI agent data exfiltration”看，这个模型发布为什么重要？

At its core, deontic runtime governance replaces the binary 'allow/deny' model with a tri-state logic: permitted (may), forbidden (must not), and obligatory (must). This mirrors the deontic modalities used in legal syste…

围绕“Open Policy Agent vs Deontic-Agent for AI governance”，这次模型更新对开发者和企业有什么影响？