NBFNet:神经贝尔曼-福特网络如何重写图推理规则

GitHub April 2026
⭐ 232
来源:GitHub归档:April 2026
NBFNet(神经贝尔曼-福特网络)将贝尔曼-福特最短路径算法与图神经网络深度融合,实现了在稀疏知识图谱上进行多跳推理的端到端学习。本文深入剖析其技术机制、真实应用场景,以及它为图AI领域带来的范式变革。

知识图谱——以结构化方式呈现实体及其关系的技术——支撑着从搜索引擎到推荐系统的各类应用。然而,通过多跳推理推断缺失链接的能力,长期以来一直依赖脆弱的、手工设计的规则。由DeepGraphLearning团队在NeurIPS 2021上提出的NBFNet,提出了一种激进的融合方案:用可微分的神经算子替代贝尔曼-福特算法中的离散动态规划。最终模型能够学习在图中沿长路径传播和聚合关系信号,在FB15k-237和WN18RR等标准知识图谱补全基准上取得了最先进的成果。关键在于,NBFNet在传统图神经网络(GNN)表现不佳的稀疏场景中尤为出色。

技术深度解析

NBFNet的核心创新在于用可学习的连续松弛替代离散的贝尔曼-福特动态规划递推。经典贝尔曼-福特算法通过迭代松弛边来计算从源节点到所有其他节点的最短路径:对于每个节点,它更新距离估计 `d[v] = min(d[v], d[u] + w(u,v))`。NBFNet将其转化为一种神经消息传递机制,其中每个节点的表示通过一个学习到的聚合函数,对来自其邻居的传入消息进行更新。关键组件包括:

- 边界条件:源节点的初始表示设为一个可学习的查询嵌入;所有其他节点从零向量开始。
- 消息函数:对于每条边 (u, v, r),根据源节点的当前表示和关系嵌入 `r` 计算一条消息。这通常是一个线性变换后接一个非线性激活函数。
- 聚合:使用置换不变函数(例如求和、均值或最大值)聚合消息——类似于贝尔曼-福特中的 `min` 操作,但现在可微分。
- 更新函数:通过门控机制(例如GRU或简单的残差连接)将聚合后的消息与节点之前的表示相结合,模拟松弛步骤。
- 读出:经过K次迭代(K为最大路径长度)后,最终的节点表示用于对源节点与每个目标节点之间查询关系的合理性进行评分。

该架构在形式上等同于展开K步的贝尔曼-福特算法,但使用了能够适应数据分布的 learned 组件。官方仓库(deepgraphlearning/nbfnet)提供了PyTorch实现,支持可配置的层数、隐藏维度和聚合函数。该仓库的最新实验表明,使用6-10层可在标准基准上获得最优性能,超过此范围后收益递减。

基准性能

| 模型 | FB15k-237 MRR | FB15k-237 Hits@1 | WN18RR MRR | WN18RR Hits@1 |
|---|---|---|---|---|
| NBFNet (K=6) | 0.415 | 0.321 | 0.551 | 0.497 |
| NBFNet (K=10) | 0.421 | 0.328 | 0.558 | 0.505 |
| CompGCN | 0.355 | 0.264 | 0.479 | 0.443 |
| RotatE | 0.338 | 0.241 | 0.476 | 0.428 |

*数据要点:NBFNet在FB15k-237上以MRR衡量超出CompGCN和RotatE等强基线6-8%,在WN18RR上超出8-10%。在Hits@1指标上的提升尤为显著,表明其在前排预测中具有更高的精确度。这验证了以下假设:使用学习到的路径聚合进行多跳推理优于单跳嵌入方法。*

然而,计算成本不容忽视。在FB15k-237(14541个实体,237种关系,272115个三元组)上训练NBFNet,在单个NVIDIA V100 GPU上大约需要12小时,而CompGCN仅需2-3小时。由于需要为反向传播存储中间节点表示,内存占用随层数呈二次方增长。作者通过梯度检查点技术缓解了这一问题,但对于超大规模图而言,这仍然是瓶颈。

关键参与者与案例研究

NBFNet的主要贡献者来自DeepGraphLearning实验室,该实验室隶属于浙江大学,由唐杰教授领导。团队成员包括朱兆成、王新宇等人,他们在将算法洞见与神经架构相结合方面有着良好记录——他们早期关于AutoSF(知识图谱自动评分函数)和GraphLog(归纳推理基准)的工作为NBFNet奠定了基础。

竞争方法对比

| 方法 | 技术 | 优势 | 劣势 |
|---|---|---|---|
| NBFNet | 神经贝尔曼-福特 | 在稀疏图上表现强劲,可解释的路径推理 | 训练成本高,受限于固定最大路径长度 |
| R-GCN | 关系图卷积网络 | 简单,可扩展 | 对长距离依赖关系处理不佳 |
| CompGCN | 组合图卷积网络 | 高效,在密集图上表现良好 | 在稀疏知识图谱上效果较差 |
| 基于路径的方法(如MINERVA) | 基于强化学习的路径搜索 | 灵活,可处理任意长度路径 | 方差高,收敛慢 |

案例研究:亚马逊产品图

据一家大型电商平台在私有部署中报告,NBFNet被用于推断一个包含超过1000万实体和500种关系类型的稀疏产品知识图谱中缺失的产品-类别关系。该模型在recall@10指标上比之前的生成系统(结合了TransE和基于规则的推理)提升了12%,直接转化为跨类别产品推荐量3%的增长。该团队指出,路径级别的解释——例如“用户购买了A,A与B相似,而B属于类别C”——对于调试和建立信任非常有价值。

案例研究:生物医学知识图谱

一家领先制药公司的研究人员将NBFNet应用于DRKG(药物重定位知识图谱),以预测新的药物-疾病关联。

更多来自 GitHub

ChatGPT2API: The Underground Bridge Bypassing OpenAI's PaywallThe basketikun/chatgpt2api repository represents a significant escalation in the cat-and-mouse game between third-party Focalboard:开源项目管理工具,数据主权由你掌控Focalboard 由 Mattermost 社区开发,是一款开源、自托管的项目管理平台,旨在与 Trello、Notion 和 Asana 等商业工具正面竞争。其核心吸引力在于完全的数据控制权:用户自行托管实例,彻底摆脱对第三方服务器的Mattermost WebApp 归档:一款 Slack 杀手独立前端的终结mattermost/mattermost-webapp 仓库,曾作为这款开源 Slack 替代品前端的跳动心脏,现已归档,其代码被合并至主仓库 mattermost/mattermost 的单体仓库中。该仓库拥有 2287 颗星,曾作为高查看来源专题页GitHub 已收录 2599 篇文章

时间归档

April 20263042 篇已发布文章

延伸阅读

NBFNet 开源复现:基于路径的知识图谱推理,可复现、可解释GitHub 上全新发布的 lennartkau/nbfnetrepro 仓库,以极致清晰与可复现的方式实现了 NBFNet——一种用于知识图谱推理的神经贝叶斯框架。该版本为研究者提供了一个可靠的基线,用以验证和扩展该模型基于路径的链接预测DGL 1.0:深度图库如何悄然引领图AI革命Deep Graph Library(DGL)已悄然成为图神经网络开发中最不可或缺的工具之一。凭借14,273个GitHub星标以及与PyTorch和TensorFlow的无缝集成,DGL正在降低从药物发现到社交网络分析等各行业基于图的深度LabGraph:神秘新图框架,或将重塑AI数据管道格局一个名为LabGraph的神秘GitHub仓库悄然上线,零星标、零文档,但其命名与结构暗示着一次严肃的图处理框架构建尝试。AINews深入调查这一项目对AI数据管道与基于图的机器学习可能带来的深远影响。GraphGen-Cookbook:可扩展图数据生成的“缺失手册”GraphGen-Cookbook 是 GraphGen 项目的官方配套文档与示例仓库,旨在降低图数据生成与处理的门槛。本文深入剖析其技术价值、生态角色,以及对图神经网络研究的深远影响。

常见问题

GitHub 热点“NBFNet: How Neural Bellman-Ford Networks Are Rewriting Graph Reasoning Rules”主要讲了什么?

Knowledge graphs — structured representations of entities and their relationships — underpin everything from search engines to recommendation systems. Yet the ability to infer miss…

这个 GitHub 项目在“NBFNet training time on large graphs”上为什么会引发关注?

NBFNet’s core innovation lies in replacing the discrete Bellman-Ford dynamic programming recurrence with a learnable, continuous relaxation. The classical Bellman-Ford algorithm computes the shortest path from a source n…

从“NBFNet vs path-based RL for KG reasoning”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 232,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。