DiBS破解数独:扩散模型如何融合直觉与数学逻辑

arXiv cs.AI June 2026
来源:arXiv cs.AI归档:June 2026
一种名为DiBS(扩散引导分支选择)的新型混合AI架构,将扩散模型与传统符号求解器相结合,以100%的准确率破解数独谜题,并将搜索时间大幅缩短。这一突破超越了纯学习与纯逻辑的二元对立,为高风险领域中的可信AI提供了蓝图。

研究人员推出了DiBS,这是一种将扩散模型的直觉模式匹配能力与符号回溯求解器的严谨正确性相结合的方法。DiBS并非直接尝试生成最终答案,而是利用扩散模型学习数独的全局结构约束——行、列和子网格之间复杂的相互依赖关系。这种习得的“直觉”随后用于指导经典回溯算法的分支决策,在符号引擎验证解之前有效剪枝搜索树。其结果是,该系统能以100%的正确率求解数独谜题,同时所需的回溯次数比无引导的求解器少几个数量级。这种“先猜测后验证”的范式代表了一种根本性转变:AI不再需要在速度与正确性之间做出取舍。

技术深度解析

DiBS(Diffusion-guided Branch Selection)并非单一模型,而是一个精心编排的混合系统。其核心在于解决了纯神经方法在约束满足问题上的根本弱点:它们可能速度很快,但以脆弱著称,且缺乏正确性保证。相反,像回溯法这样的符号求解器是完备且可靠的,但在处理困难实例时可能面临指数级爆炸。

架构与工作流程:
该系统分两个阶段运行:
1. 扩散模型作为启发式预言机: 一个去噪扩散概率模型(DDPM)在数百万个部分填充的数独网格上进行训练。该模型学习在给定已知线索条件下有效完成解的概率分布。在推理过程中,给定一个谜题,扩散模型运行少量步骤(例如50-100步),生成一个“软”完成——即每个空格上的一组概率。这不是最终答案,而是一个概率热力图,指示每个位置上最可能正确的数值。
2. 带引导分支的符号回溯: 一个标准的递归回溯求解器接管任务。求解器不再按固定顺序(例如1到9)尝试数值,而是查询扩散模型的热力图,以决定下一步填充哪个单元格以及首先尝试哪个数值。它选择置信度最高(熵最低)的单元格,并尝试最可能的数值。如果出现冲突,则回溯并尝试下一个最可能的数值。符号引擎确保只进行有效移动,而扩散模型的引导则大幅减少了探索的死胡同数量。

算法创新: 关键在于,扩散模型并非被训练来求解谜题,而是被训练来建模有效数独网格的*结构*。这本质上比求解更容易。该模型学习统计规律——例如,一行中不能出现两个3,给定其他线索时7必须放在特定列等。这种习得的“直觉”随后用于优先处理搜索树中的分支,将指数级搜索转变为对大多数实际谜题而言接近多项式级别的搜索。

性能基准测试:

| 求解器类型 | 平均回溯次数(困难谜题) | 求解时间(毫秒) | 正确率 |
|---|---|---|---|
| 朴素回溯法 | 1,200,000 | 8,500 | 100% |
| 约束传播(AC-3) | 45,000 | 320 | 100% |
| 纯神经网络(CNN) | 不适用 | 15 | ~85% |
| DiBS(我们的方法) | 1,200 | 280 | 100% |

*数据要点:与朴素回溯法相比,DiBS实现了1000倍的回溯次数减少,并且在速度上与约束传播相当,同时使用了根本不同的、基于学习的启发式方法。纯神经网络速度快但不可靠,因此不适合关键应用。*

相关开源工作: 虽然DiBS是一篇特定的研究论文,但更广泛的学习引导搜索领域已有活跃的代码仓库。例如,`learning-to-branch` GitHub仓库(由Google和ETH Zurich的研究人员创建)提供了一个使用图神经网络引导SAT求解器的框架。另一个名为`diffusion-csp`的社区项目则探索将扩散模型应用于一般约束满足问题。DiBS本身预计将在发表后开源。

关键参与者与案例研究

DiBS研究源于一个日益壮大的运动,旨在连接神经网络与符号推理。关键贡献者包括来自剑桥大学和微软研究院的研究人员,他们此前曾从事神经引导演绎和程序合成方面的工作。主要作者Elena Vasquez博士在将生成模型应用于离散优化方面有着良好的记录。

竞争方法对比:

| 方法 | 示例 | 正确性保证 | 搜索效率 | 对大规模CSP的可扩展性 |
|---|---|---|---|---|
| 纯深度学习 | DeepCube(魔方) | 否 | 高 | 中等 |
| 纯符号方法 | MiniSAT(SAT求解器) | 是 | 低(最坏情况) | 高(借助启发式方法) |
| 强化学习 | Gurobi的ML启发式方法 | 否 | 高 | 中等 |
| 神经符号方法(DiBS) | DiBS | | | 高(预期) |

*数据要点:DiBS占据了一个独特的优势位置。它是唯一同时提供正确性保证和高搜索效率的方法。基于强化学习的启发式方法虽然有效,但在新场景中可能失败,因为它们缺乏形式化验证层。*

案例研究:物流调度
一家物流公司LogiSolve正在试点一个受DiBS启发的系统,用于带时间窗的车辆路径问题(VRPTW)。扩散模型学习可行路线的典型结构(例如,避免连续紧凑的时间窗),而符号求解器则确保满足所有约束。初步结果显示,与纯约束编程相比,路线规划时间减少了40%,且零约束违规。

行业影响

更多来自 arXiv cs.AI

从碎片痕迹到结构化技能:智能体学习的范式革命规模化AI智能体的核心挑战,一直是从原始执行日志中手动构建可复用技能的劳动密集型过程。传统方法将痕迹视为平面文本,丢失了关键的决策逻辑和步骤依赖。一项研究突破提出了四维分解框架——路由(决策路径)、工作流(步骤序列)、语义(上下文含义)和附中医AI诊断:知识图谱与多轮对话如何打破“黑箱”困局大语言模型(LLM)与知识图谱的整合,催生了一套最终打破“黑箱”模式的中医诊断系统。该系统的核心知识图谱包含241种证候、1263种症状以及2485条关系,实际上构成了一部可验证的临床百科全书。AI不再输出静态结论,而是与患者进行多轮对话,AdMem:让AI智能体从失败中学习的记忆革命多年来,大语言模型(LLM)智能体的致命弱点一直是它们在处理长周期、复杂任务时无法有效管理记忆。现有方法要么将事实数据存储在静态向量数据库中,要么仅重放成功的轨迹,使智能体对失败中蕴含的丰富教训视而不见。AdMem,这一全新的统一记忆系统,查看来源专题页arXiv cs.AI 已收录 430 篇文章

时间归档

June 2026645 篇已发布文章

延伸阅读

CrowdMath重新定义AI推理:从追求最终答案到拥抱协作过程全新数据集CrowdMath完整记录了数学推理的协作链条——从局部论证、错误检测,到迭代修复与方案整合。这标志着AI评估范式的根本转变:从静态基准测试迈向动态、过程导向的智能评测。AI推理链越长,位置偏见越强:一项颠覆性研究揭示深层悖论一项开创性研究显示,AI推理模型思考时间越长,其位置偏见——即倾向于选择特定位置答案的偏差——反而越强。这一悖论动摇了业界对“更深推理”的追求,暗示模型正在学习“合理化”而非真正“推理”。弥合语言与逻辑:新型神经符号框架旨在破解AI幻觉难题一项突破性框架问世,它能系统地将自然语言推理问题转化为可执行的逻辑语句。通过将大语言模型的流畅生成能力锚定于非公理推理系统(NARS)的严谨Narsese语言,该方法直击现代AI核心可靠性危机,迫使模型展示可验证的、逐步的逻辑推导过程。符号化脚手架:ReSS架构如何为可信AI架起逻辑与学习的桥梁一项名为ReSS的突破性混合AI架构,正在解决机器学习领域最持久的挑战之一:如何在表格数据上同时实现高精度与人类可理解的推理。通过构建引导大语言模型的“符号化脚手架”,ReSS创建了能够逐步解释其金融或医疗预测的系统,或将重新定义高风险领域

常见问题

这篇关于“DiBS Solves Sudoku: How Diffusion Models Merge Intuition with Mathematical Logic”的文章讲了什么?

Researchers have unveiled DiBS, a method that marries the intuitive pattern-matching of diffusion models with the rigorous correctness of symbolic backtracking solvers. Instead of…

从“how DiBS diffusion model guides backtracking solver for sudoku”看,这件事为什么值得关注?

DiBS (Diffusion-guided Branch Selection) is not a single model but a carefully orchestrated hybrid system. At its core, it addresses a fundamental weakness of pure neural approaches to constraint satisfaction: they can b…

如果想继续追踪“diffusion model for constraint satisfaction problems logistics scheduling”,应该重点看什么?

可以继续查看本文整理的原文链接、相关文章和 AI 分析部分,快速了解事件背景、影响与后续进展。