Tesseron颠覆AI Agent控制逻辑:开发者划定边界,拒绝黑箱决策

Hacker News April 2026
来源:Hacker News归档:April 2026
Tesseron发布全新AI Agent API框架,彻底反转传统控制流:不再是Agent自主决定调用哪些工具,而是由应用开发者预先定义严格的行为边界。这一设计旨在让AI Agent变得可预测、安全且可组合,有望弥合实验性Demo与生产级系统之间的鸿沟。

当前AI Agent生态系统的核心矛盾在于灵活性与确定性之间的博弈。LangChain、AutoGPT、CrewAI等主流框架赋予模型极大的自主权,让它们自行选择工具并编排工作流。虽然这能催生令人印象深刻的演示效果,但也带来了不可预测性、安全漏洞(例如提示注入导致意外工具调用)以及审计困难等问题。Tesseron的方案是一次根本性的架构重构:开发者编写一份API契约——一个包含允许操作、参数和业务逻辑的精确模式——而Agent则严格在该沙箱内运行。这不仅仅是一个安全包装层,更是Agent推理范式的转变。Agent不再“决定”使用哪个工具,而是从一个预先授权的菜单中进行选择。

技术深度解析

Tesseron的架构围绕一个名为“行为API契约”(Behavioral API Contracts,简称BAC)的概念构建。与传统Agent框架(模型接收工具描述列表,然后利用内部推理选择其一)不同,Tesseron在模型与工具之间插入了一个确定性的“策略引擎”。开发者通过YAML或JSON模式定义以下内容:

- 允许的操作:一个有限的操作集合(例如 `search_catalog`、`check_inventory`、`place_order`)。
- 参数约束:针对每个操作,开发者定义必填字段、数据类型和取值范围(例如 `quantity` 必须是1到10之间的整数)。
- 执行顺序:可选地,定义一个允许工作流的有向无环图(DAG)(例如 `check_inventory` 必须在 `place_order` 之前执行)。
- 回退行为:当请求模糊或违反约束时,Agent应执行的操作——例如请求澄清、升级到人工处理,或返回默认响应。

Agent的LLM(目前支持GPT-4o、Claude 3.5,以及通过插件接口支持Llama 3等开源模型)仅用于自然语言理解和生成。实际的工具调用由策略引擎处理,该引擎在执行前根据BAC验证每一次调用。这消除了“幻觉工具调用”——即Agent凭空捏造不存在的函数或误用参数这一常见故障模式。

GitHub参考:开源仓库 `tesseron/tesseron-api-spec`(截至2026年4月已获2.3k星标)包含一个Python SDK、一个基于Rust实现的高性能策略引擎参考实现,以及一个用于本地测试BAC的命令行工具。Rust引擎使用基于Z3 Prover的形式化验证模块,检查开发者约束中的逻辑矛盾——例如,如果一条规则规定“始终将超过1000美元的订单升级处理”,而另一条规则规定“自动批准所有订单”,引擎将拒绝部署。

性能基准测试:在内部测试中,Tesseron Agent在相同任务上的延迟比等效的LangChain Agent低40%,因为策略引擎绕过了LLM的工具选择推理循环。然而,在“为模糊查询找到最佳产品”等开放式任务上,受约束模型的得分低了12%——这是一个可预见的权衡。

| 指标 | Tesseron(受约束) | LangChain(自主) | 差异 |
|---|---|---|---|
| 工具调用准确率 | 99.2% | 87.4% | +11.8% |
| 每次调用平均延迟 | 320ms | 530ms | -39.6% |
| 边缘情况成功处理率 | 68% | 82% | -14% |
| 安全事件(每万次调用) | 0.2 | 4.7 | -95.7% |

数据要点:Tesseron的约束方法以牺牲灵活性为代价,显著提升了可靠性和安全性。对于一致性至关重要的生产系统而言,这是一个有利的权衡。仅延迟改进一项——接近40%——就为高吞吐量的企业部署提供了有力论据。

关键参与者与案例研究

Tesseron由一群前Google和前AWS工程师创立,他们曾参与Borg(Google的集群管理器)和AWS Step Functions的开发。他们在确定性编排方面的背景在框架设计中体现得淋漓尽致。该公司已从包括红杉资本和一家隐身模式的国防承包商在内的财团获得了1200万美元的种子轮融资。

竞争方案对比

- LangChain:最流行的开源Agent框架。它赋予模型高度自主权,但依赖事后添加的“回调”和“护栏”。LangChain的LangSmith产品增加了可观测性,但并未提供部署前的约束执行。
- CrewAI:专注于多Agent协作,但同样缺乏正式的约束层。Agent仍然可能在整个团队中产生幻觉工具调用。
- Microsoft AutoGen:提供了一个带有部分人机协作功能的对话式Agent框架,但模型仍然主导工具选择。
- OpenAI的Function Calling:最接近的原生替代方案——开发者定义函数模式,但模型仍然决定调用哪个函数。不强制执行执行顺序或业务规则。

| 框架 | 约束执行 | 执行顺序控制 | 形式化验证 | 开源 |
|---|---|---|---|---|
| Tesseron | 是(策略引擎) | 是(基于DAG) | 是(Z3 Prover) | 是 |
| LangChain | 否(事后护栏) | 否 | 否 | 是 |
| CrewAI | 否 | 部分(顺序任务) | 否 | 是 |
| AutoGen | 否 | 否 | 否 | 是 |
| OpenAI Function Calling | 否 | 否 | 否 | 否 |

数据要点:Tesseron是唯一一个在执行层面强制执行约束的框架,而非依赖模型的合规性。这是一个根本性的架构差异,而非一个功能开关。

案例研究——金融科技初创公司“ClearPay”:ClearPay是一家先买后付服务提供商,部署Tesseron来处理客户退款请求。此前,他们的LangChain Agent偶尔会因幻觉工具调用而发放超过原始购买金额的退款,导致财务损失。迁移到Tesseron后,ClearPay在BAC中定义了严格的退款规则:退款金额不得超过原始交易金额,且必须经过双重验证。部署后,ClearPay报告称退款错误率降至零,同时处理时间缩短了35%。

更多来自 Hacker News

Mythos模型泄露调查:前沿AI安全范式暴露致命漏洞AI研究界正深刻反思Anthropic对其内部代号为'Mythos'的前沿模型可能遭未授权访问的持续调查所揭示的深远影响。尽管细节仍处保密状态,但调查本身的存在已标志着一个关键的转折点。这不仅仅是关于知识产权被盗或竞争优势受损,更代表了首起无标题Anthropic's internal investigation into the alleged breach of Mythos AI is not a routine security incident—it is a fundaGo AI库以轻量API设计挑战Python霸主地位长期以来,AI开发领域一直被Python主导,但一款名为go-AI的新开源库正在挑战这一传统。由开发者Rcarmo创建的go-AI为Go开发者提供了一个简洁、统一的API,使其能够调用多种AI推理后端,而无需承受Python运行时或复杂依赖查看来源专题页Hacker News 已收录 2303 篇文章

时间归档

April 20262074 篇已发布文章

延伸阅读

AI智能体获得数字钱包:PayClaw如何解锁自主经济行动者随着专用数字钱包的出现,AI智能体领域正在经历根本性变革。这一基础设施的演进将AI从脚本化辅助工具,升级为能够执行微支付、资源采购等自主经济行为的行动者,从而开启机器驱动商业的新纪元。60万美元的AI服务器:NVIDIA B300如何重塑企业AI基础设施格局围绕NVIDIA旗舰B300 GPU打造的服务器价格逼近60万美元,标志着AI基础设施战略的决定性转向。这已不仅是购买算力,更是对前沿AI应用未来的战略押注。核心问题从‘需要多少算力’演变为‘将用它运行什么’,迫使企业重新定义其AI战略的终SUSE与NVIDIA推出“主权AI工厂”:企业AI堆栈迈入产品化时代SUSE与NVIDIA联合发布预集成的“AI工厂”解决方案,将算力、软件与管理工具打包成符合主权要求的软硬一体设备。此举标志着市场正从销售离散工具转向提供完整产品化AI环境,直击金融、医疗和政府领域对完全在受控内部环境中运行AI的迫切需求。开放权重革命:生产级AI部署如何进入主权控制时代一场静默的革命正在重塑企业部署人工智能的方式。焦点已从API与开源之争,决定性转向“开放权重”模型的实际主导地位——这些完全训练好且公开可用的神经网络,正成为生产系统的新基石。这一范式让企业能在能力、数据控制与成本间达成前所未有的平衡。

常见问题

这次公司发布“Tesseron Flips AI Agent Control: Developers Define Boundaries, Not Black Boxes”主要讲了什么?

The core tension in today's AI agent ecosystem is flexibility versus determinism. Current frameworks like LangChain, AutoGPT, and CrewAI grant models significant autonomy to choose…

从“Tesseron vs LangChain for enterprise agents”看,这家公司的这次发布为什么值得关注?

Tesseron's architecture is built around a concept they call 'Behavioral API Contracts' (BAC). Unlike traditional agent frameworks where the model receives a list of tool descriptions and uses its internal reasoning to pi…

围绕“How to define behavioral API contracts for AI agents”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。