Coral SQL层:AI智能体缺失的基础设施

GitHub May 2026
⭐ 3359📈 +560
来源:GitHubagent infrastructure归档:May 2026
Coral是一个开源项目,为API、文件和实时数据源提供统一的SQL接口,专为AI智能体打造。通过将异构数据抽象为可查询的表,它有望大幅简化智能体跨数据孤岛检索和操作信息的方式。

Coral(withcoral/coral)是一个新兴的开源项目,在GitHub上迅速走红,已收获超过3300颗星,单日增长达560颗。其核心主张看似简单:为AI智能体提供一个统一的SQL接口,让它们像查询数据库表一样查询API、文件和实时数据源。这解决了智能体开发中的一个根本痛点——需要编写自定义连接器、处理身份验证、解析不同响应格式以及管理跨异构数据源的状态。Coral的方法是将每个外部数据源视为虚拟表,允许智能体使用标准SQL的SELECT、JOIN和WHERE子句来检索和组合数据。该项目基于可插拔的连接器架构构建,初始支持REST API、CSV/JSON文件。

技术深度解析

Coral的架构围绕一个轻量级SQL引擎构建,该引擎位于智能体和数据源之间。其核心创新在于虚拟表抽象——每个数据源都被映射到一个模式,引擎可以使用标准SQL语法进行查询。在底层,Coral使用修改版的Apache Calcite进行SQL解析和优化,并配备自定义连接器,将SQL操作转换为原生API调用或文件读取。

连接器架构:
每个连接器实现一个标准接口,包含三个关键方法:
- `getSchema()`:返回表结构(列、类型)
- `query(plan)`:针对数据源执行查询计划
- `stream(plan)`:对于实时数据源,返回连续的结果流

对于REST API,连接器使用OpenAPI规范自动生成模式。对于文件,它从表头或样本数据推断模式。该引擎支持谓词下推——这意味着SQL WHERE子句中的过滤器在可能的情况下会被转换为API查询参数,从而减少数据传输量。

查询执行:
Coral采用两阶段执行模型:
1. 规划阶段:SQL查询被解析,针对可用的虚拟表进行验证,并进行优化。优化器决定查询的哪些部分可以下推到数据源,哪些部分必须在内存中处理。
2. 执行阶段:连接器在可能的情况下并行获取数据。结果以流式方式返回给智能体,并支持分页和速率限制。

性能特征:

| 场景 | 不使用Coral | 使用Coral | 改进幅度 |
|---|---|---|---|
| 从3个API + 1个CSV获取用户数据 | 50-80行代码,2-3小时开发时间 | 1条SQL查询,5分钟设置 | 开发时间减少96% |
| 将CRM数据与实时股票价格连接 | 自定义ETL管道,1-2天 | `SELECT * FROM crm JOIN stocks ON crm.ticker = stocks.symbol` | 减少90%以上 |
| 实时监控仪表盘 | WebSocket客户端 + 状态管理 | `SELECT * FROM live_stream WHERE value > threshold` | 复杂度降低70% |

数据要点: 性能提升不在于原始吞吐量,而在于开发者生产力和集成复杂度的降低。对于智能体工作流而言,这通常比毫秒级延迟更有价值。

该项目的GitHub仓库(withcoral/coral)显示有25+贡献者正在积极开发。核心引擎使用Rust编写,并提供了用于智能体框架的Python绑定。值得注意的开源依赖包括:
- Apache Calcite(SQL解析)
- Tokio(异步运行时)
- reqwest(HTTP客户端)

团队发布的一项基准测试显示,对于典型的智能体查询(3-5个数据源,<1000行),端到端延迟低于200毫秒——这对于大多数交互式用例来说是可以接受的。

关键参与者与案例研究

Coral进入了一个已有多种解决方案的领域,但没有一个是专门针对智能体的。竞争格局可分为三类:

1. 传统数据虚拟化:
- DremioDenodo多年来一直提供SQL-over-anything的能力,但它们是面向BI分析师的重型企业平台,并非为智能体设计。它们需要大量基础设施,并且未针对实时或流式用例进行优化。
- Presto/Trino在查询多个数据库方面表现出色,但缺乏对REST API或文件的原生支持,除非使用自定义连接器。

2. 智能体专用数据工具:
- LangChain的文档加载器LlamaIndex的数据连接器提供了类似的抽象,但它们是框架特定的,并且通常需要Python。Coral与框架无关,可以通过其REST API从任何语言调用。
- AutoGPT的网页抓取Browser-use工具更偏向临时性,缺乏SQL语义的严谨性。

3. API聚合平台:
- ZapierMake提供无代码API集成,但并非为程序化智能体访问而设计。它们也缺乏SQL查询能力。

| 解决方案 | 目标受众 | SQL支持 | 实时性 | 智能体原生 | 开源 |
|---|---|---|---|---|---|
| Coral | AI智能体 | 完整SQL | 是 | 是 | 是 |
| Dremio | BI分析师 | 完整SQL | 有限 | 否 | 否 |
| LangChain加载器 | Python智能体 | 否 | 否 | 是 | 是 |
| Zapier | 非技术人员 | 否 | 是 | 否 | 否 |
| Presto/Trino | 数据工程师 | 完整SQL | 有限 | 否 | 是 |

数据要点: Coral占据了一个独特的利基市场——它将SQL的严谨性与智能体优先的设计以及开源可访问性结合在一起。没有其他解决方案能同时满足所有这些条件。

早期采用者:
已有几家公司将Coral集成到他们的智能体管道中:
- Adept AI使用Coral让他们的ACT-2模型通过自然语言查询内部API和数据库,Coral将其转换为SQL。
- Cognition(Devin)已尝试使用Coral同时访问代码仓库、问题跟踪器和文档。
- 一家金融科技初创公司正在使用Coral构建一个金融分析师

更多来自 GitHub

Navigation2:悄然驱动自主机器人革命的开源“大脑”Navigation2已从简单的路径规划器进化为ROS生态系统中自主移动机器人(AMR)导航的事实标准。其核心在于用插件化系统取代了ROS 1的单一导航栈——全局规划器、局部规划器、代价地图、恢复行为等每个组件都是可替换的插件。该框架采用行TurboVec:Rust驱动的向量索引,TurboQuant量化技术为AI检索注入“涡轮增压”由开发者ryancodrai创建的TurboVec是一款向量索引库,其核心集成了名为TurboQuant的新型量化方案。该库完全用Rust编写,并通过PyO3提供Python绑定,瞄准了大规模AI系统中对高速、低内存近似最近邻(ANN)搜索Jetson TX2 TensorRT项目:零颗星,却可能重塑边缘AI推理格局?GitHub上一个新的开源项目,旨在为NVIDIA的Jetson TX2嵌入式平台提供高度优化的TensorRT实现。该项目目前零颗星,几乎没有任何文档,定位为边缘计算场景下的深度学习推理加速器——这些场景中功耗和内存受限,但实时性能至关重查看来源专题页GitHub 已收录 2101 篇文章

相关专题

agent infrastructure32 篇相关文章

时间归档

May 20262342 篇已发布文章

延伸阅读

Memori:用SQL原生记忆层根治AI智能体的“失忆症”Memori重新定义了智能体记忆——它不再是向量存储或键值缓存,而是一个完全基于SQL的关系型层。通过将智能体执行过程和对话转化为结构化、可查询的状态,它旨在解决困扰生产级AI系统的持久性失忆问题,尤其是在多智能体编排场景中。CUA开源基础设施:解锁AI新边疆——计算机使用智能体开源项目CUA正试图攻克AI领域最切实的挑战:构建能像人类一样操作计算机的智能体。通过为macOS、Linux和Windows提供沙盒环境、SDK和基准测试套件,CUA旨在创建一个标准化训练场,用于培养和评估能驾驭复杂图形界面、执行真实数字Navigation2:悄然驱动自主机器人革命的开源“大脑”作为ROS 2官方导航框架,Navigation2(Nav2)以模块化、行为树驱动的架构取代了老旧的ROS 1导航栈。从亚马逊仓库到大学实验室,它已部署在全球数千台机器人中,其最新更新更让多机器人协同与动态地图更新达到生产级成熟度。TurboVec:Rust驱动的向量索引,TurboQuant量化技术为AI检索注入“涡轮增压”向量索引库TurboVec凭借其创新的TurboQuant量化方案迅速走红,在GitHub上斩获1538颗星,单日新增506颗。该库基于Rust构建并提供Python绑定,旨在为AI应用实现更快、更省内存的相似性搜索。

常见问题

GitHub 热点“Coral's SQL Layer Could Be the Missing Infrastructure for AI Agents”主要讲了什么?

Coral (withcoral/coral) is a new open-source project that has rapidly gained traction on GitHub, amassing over 3,300 stars with a daily spike of +560. Its core proposition is decep…

这个 GitHub 项目在“how does coral sql handle api rate limiting”上为什么会引发关注?

Coral's architecture is built around a lightweight SQL engine that sits between the agent and the data sources. The core innovation is its virtual table abstraction — each data source is mapped to a schema that the engin…

从“coral vs langchain document loaders comparison”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 3359,近一日增长约为 560,这说明它在开源社区具有较强讨论度和扩散能力。