大语言模型重写数据库内核:从SQL生成到自主查询优化

Hacker News April 2026
来源:Hacker News归档:April 2026
一场静默的革命正在企业数据系统的核心地带展开。大语言模型不再满足于仅仅将自然语言翻译成SQL,它们正被直接部署用于优化查询执行计划本身。这标志着AI从应用层工具到核心系统组件的范式转变,有望带来前所未有的性能提升。

AI应用的前沿正从用户界面转向企业软件的引擎室。一个重要的新趋势是,LLM正被直接集成到数据库内核中,其任务不再是编写查询,而是优化这些查询的执行方式。这远远超越了如今已司空见惯的自然语言转SQL翻译。相反,LLM正被训练来理解查询意图、分析数据模式和统计信息,并提出或选择更优的执行路径——这一角色历来由数据库基于成本的优化器(CBO)专属。传统的CBO依赖于僵化的数学模型和预先收集的统计信息,在处理复杂的多表连接查询或快速演变的数据分布时可能严重失效。而LLM在大量代码、执行计划日志和查询结果的数据集上进行训练,能够捕捉到传统统计模型难以察觉的微妙模式和关联。这种能力使它们能够预测哪种连接顺序、索引使用或数据分片策略在特定上下文中效果最佳,有时甚至能发现人类专家或传统优化器会忽略的反直觉优化方案。这不仅仅是渐进式改进,而是朝着真正“自治”数据库系统迈出的关键一步,系统能够持续学习并适应其独特的工作负载和数据特征。

技术深度解析

将LLM集成到查询优化中代表了一次根本性的架构转变。传统的基于成本的优化器遵循一个确定性流程:解析SQL,生成一组逻辑上等价的查询计划,使用基于基数估计、I/O和CPU成本的模型为每个计划分配成本,然后选择成本最低的计划。该模型的弱点在于其依赖准确的统计信息,且无法处理未见过的查询模式或复杂的相关性。

基于LLM的优化器通过以下几种关键方式颠覆了这一流程:

1. 基于学习的成本建模: 与固定公式不同,LLM可以被训练来预测候选计划的实际执行时间或资源消耗。训练数据由查询计划与其实际执行指标(延迟、CPU周期、I/O)配对组成。像 PostgreSQL的pg_hint_plan 扩展或微软的 Query Embeddings 研究等项目展示了如何将计划特征向量化以供模型使用。
2. 利用启发式智能进行计划空间剪枝: 复杂查询的可能执行计划空间极其庞大。LLM可以充当智能剪枝器,利用其对语义上下文的理解(例如,“这是一个时间序列汇总查询”)来立即丢弃不合理的计划形态,并将搜索集中在有希望的区域。这类似于国际象棋引擎使用启发式方法来避免评估明显糟糕的走法。
3. 跨优化洞察: LLM可以关联不同查询之间以及随时间推移的优化决策。例如,它可能观察到创建某个复合索引,虽然前期成本较高,却能显著改善一整类频繁查询的性能——这是专注于单个查询的传统CBO会忽略的整体性洞察。

该领域一个开创性的开源项目是 “Bao”(最初来自威斯康星大学麦迪逊分校,现在有社区分支)。Bao使用强化学习,根据观察到的性能来学习应对PostgreSQL数据库应用哪些查询提示。虽然严格来说它不是一个LLM,但其架构——一个与传统优化器并存并覆盖其决策的学习模型——是LLM集成的蓝图。

近期的基准测试虽然仍处于早期阶段,但已显示出有希望的结果。在连接顺序基准测试(JOB)的受控测试中,早期学习型优化器原型已能找出比PostgreSQL原生优化器为最复杂查询选择的执行计划快2-3倍的执行计划。

| 优化方法 | 核心机制 | 优势 | 劣势 |
|---|---|---|---|
| 传统基于成本的优化器 | 静态成本公式,直方图统计 | 久经考验、稳定、可预测 | 对关联数据、复杂连接处理不佳;需要完美的统计信息 |
| 强化学习(例如,Bao) | 学习计划提示的奖励(延迟) | 适应特定工作负载 | 需要大量训练;难以适应突然变化 |
| 基于LLM的优化器 | 对查询/数据的语义理解,通过嵌入向量预测成本 | 可泛化,能推理未见模式,具有整体视图 | 推理延迟高;决策是“黑盒”;内存占用大 |

数据要点: 上表演示了从僵化的、基于规则的系统向自适应的、基于学习的系统的演进。LLM在泛化能力和整体推理方面潜力最大,但也带来了延迟和可解释性方面的新挑战,这些必须在生产使用中解决。

主要参与者与案例研究

构建AI优化数据库的竞赛正在初创公司和行业巨头之间展开,各方策略各异。

注入AI的行业巨头:
* 微软(Azure SQL Database, Cosmos DB): 微软正深度整合其Azure OpenAI能力。虽然未公开详述完整的基于LLM的优化器,但其 “Azure SQL Database Automatic Tuning” 使用机器学习来检测和修复性能回归,应用索引和计划强制建议。合乎逻辑的下一步是使用像GPT-4-Turbo这样的模型,基于对性能问题的自然语言描述来生成这些建议。
* 谷歌云(AlloyDB, Spanner): 谷歌利用其基础性AI研究。AlloyDB的智能缓存和列式引擎已使用ML进行预测。谷歌研究院在 “Learned Cardinality Estimation” 方面的工作直接针对CBO的一个核心弱点。集成像PaLM 2这样的模型来监督整个优化过程,是一个合理的路线图。
* 甲骨文(Autonomous Database): 甲骨文的旗舰产品被定位为“自治”。其机器学习模型持续监控工作负载和配置,执行索引管理和SQL计划调优。纳入大型基础模型以理解业务上下文(例如,“优先处理季度末报告查询”)将是这一愿景的自然演进。

AI原生初创公司:

更多来自 Hacker News

告别图形界面:为什么硬核用户正从LM Studio转向llama.cpp——原始性能的胜利本地大语言模型社区正经历一场悄然却深刻的工具迁徙——从LM Studio等图形化启动器转向llama.cpp等裸金属推理引擎。AINews观察到,尽管LM Studio提供了友好的上手体验,但其抽象层引入的延迟和内存开销随着模型规模的膨胀变AI的真正天花板不是算力,而是人类的判断力多年来,AI领域的讨论始终聚焦于一个问题:“机器能变得多聪明?”但一个更根本的问题已经浮现——工具已经超越了用户。从企业级LLM部署到消费级视频生成平台,限制因素不再是模型能力,而是人类对模型输出施加的判断质量。一个顶级推理模型,如果输入的Lago开源SDK终结AI计费中间件:一场透明化革命开源计费平台Lago推出了全新SDK,使开发者无需依赖第三方中间件,即可在令牌级别追踪和计费AI使用量。该SDK提供实时用量监控、灵活定价层级,并与主流LLM提供商直接集成。此举意义重大,因为AI计费历来是个黑箱:开发者要么估算令牌消耗,要查看来源专题页Hacker News 已收录 4018 篇文章

时间归档

April 20263042 篇已发布文章

延伸阅读

SynapCores:一个数据库统治向量、图、SQL与AI工作负载SynapCores提出了一项激进的AI基础设施简化方案:将向量搜索、图数据库、SQL、AutoML和LLM编排整合到一个统一引擎中。AINews深入探讨这种“一体化”方法能否真正取代当前碎片化的专业数据库生态,以及它对AI开发未来的深远影LLM学会像DBA一样思考:SQL连接顺序优化迎来“智能大脑”大语言模型不再只是编写SQL——它们正在学习为多表查询思考最优的连接顺序。最新研究表明,LLM能够推理基数、选择性和中间结果大小,在复杂连接上超越传统基于成本的优化器,为AI增强的数据库调优开辟了新时代。告别图形界面:为什么硬核用户正从LM Studio转向llama.cpp——原始性能的胜利一场无声的迁徙正在重塑本地AI生态:硬核用户正纷纷抛弃LM Studio等图形化启动器,转而拥抱llama.cpp的裸金属性能。AINews深度解析从K-quant量化到零开销GPU卸载的技术驱动力,揭示为何这一转变成为在消费级硬件上运行7AI的真正天花板不是算力,而是人类的判断力纯技术竞赛的AI时代已经终结。我们的分析揭示,最先进的模型在缺乏辨别力的用户手中也会失败。下一个前沿不是更大的模型,而是训练人类与机器并肩进行批判性思考。

常见问题

这次模型发布“LLMs Rewrite Database Kernels: From SQL Generation to Autonomous Query Optimization”的核心内容是什么?

The frontier of AI application is moving from the user interface to the engine room of enterprise software. A significant new trend sees LLMs being integrated directly into databas…

从“How does LLM query optimization differ from AI writing SQL?”看,这个模型发布为什么重要?

The integration of LLMs into query optimization represents a fundamental architectural shift. Traditional cost-based optimizers operate on a deterministic pipeline: parse SQL, generate a set of logically equivalent query…

围绕“What are the risks of using an AI for database query planning?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。