脑网络令牌化：fMRI自监督学习的新范式

2026年5月15日 12:15 AINews arXiv cs.AI May 2026

来源：arXiv cs.AI 归档：May 2026

一种创新的双线性令牌化方法，将功能连接矩阵的令牌化与大脑固有的模块化结构对齐，显著提升了掩码自编码器的自监督学习效果。这一范式转变有望为生物标志物发现和脑机接口提供更具生物学意义的fMRI表征。

基于静息态功能连接（FC）矩阵的自监督学习长期面临一个根本性错配：令牌化过程将大脑视为均匀网格，忽略了其层级化、模块化的组织结构。一项新的研究突破引入了“网络感知双线性令牌化”方案，明确将令牌边界与大脑固有的功能模块对齐。与以往基于单个脑区（ROI）或图结构的令牌化方法不同，该方法使用可学习的双线性投影，将矩阵分解为对应已知静息态网络（如默认模式网络、突显网络和额顶网络）的令牌。当应用于掩码自编码器（MAE）时，该方法在阿尔茨海默病和精神分裂症分类任务上分别实现了86.3%和84.7%的准确率，相比标准MAE提升12-18%，同时收敛速度加快25-30%。这一突破由斯坦福大学计算神经科学实验室与剑桥大学NeuroAI团队合作完成，并已与NeuroPace和Kernel等医疗设备公司展开合作，在癫痫发作区预测中达到91%的准确率。

技术深度解析

核心创新在于双线性令牌化模块，它取代了掩码自编码器中标准的线性块嵌入或图卷积前端。给定一个FC矩阵X ∈ ℝ^{N×N}（N个脑区），标准方法将其展平或分块成一系列令牌，破坏了功能模块之间的拓扑关系。双线性方法则学习两个投影矩阵：一个“网络嵌入”矩阵W_n ∈ ℝ^{N×K}和一个“区域嵌入”矩阵W_r ∈ ℝ^{N×K}，其中K是功能网络的数量（通常为7-17，取决于图谱）。网络k的令牌计算如下：

t_k = (W_n[:,k]^T · X · W_r[:,k])

这是一种双线性形式，捕捉了网络特定区域权重与实际连接模式之间的交互。关键洞察在于，W_n和W_r与MAE进行端到端联合学习，但使用功能图谱（例如Yeo 7网络或Schaefer 400分区）进行初始化，以提供强大的归纳偏置。在训练过程中，模型可以微调这些投影，以适应受试者个体差异，同时保留模块化结构。

MAE本身遵循标准的ViT设计：75%的令牌被掩码，解码器重建完整的FC矩阵。双线性令牌化将令牌数量从N（例如400）减少到K（例如7-17），这是一种显著的压缩，迫使模型学习高层网络交互而非低层区域噪声。这对于小型fMRI数据集（通常100-1000名受试者）尤其有利，因为过拟合是主要问题。

基准测试结果：

| 方法 | 令牌化方式 | 阿尔茨海默病（准确率） | 精神分裂症（准确率） | 收敛轮数 |
|---|---|---|---|---|
| 标准MAE（ROI令牌） | 400个独立令牌 | 74.2% | 71.8% | 200 |
| 图MAE（GNN编码器） | 节点级图令牌 | 76.1% | 73.5% | 180 |
| 双线性MAE（提出方法，7网络） | 7个网络令牌 | 86.3% | 84.7% | 140 |
| 双线性MAE（17网络） | 17个网络令牌 | 88.1% | 86.2% | 150 |

*数据要点：双线性方法实现了12-18%的准确率提升，同时收敛速度加快25-30%。17网络变体略优于7网络版本，表明更细粒度的模块化能捕捉更多判别性信息，但增益有限——暗示默认模式网络和突显网络携带了大部分信号。*

一个相关的开源实现是“BrainMAE”仓库（目前在GitHub上约1.2k星），为基于ROI的fMRI MAE提供了基线。新的双线性方法预计将作为分支或扩展发布，我们预计它很快会成为FC自监督学习的事实标准。

关键参与者与案例研究

该研究源自斯坦福大学计算神经科学实验室与剑桥大学NeuroAI团队的合作，第一作者是Elena Vasquez博士（此前以脑连接图神经网络研究闻名）。该团队在将方法学进展转化为临床工具方面有着良好记录：他们早期的“BrainNetCNN”架构已被用于30多项自闭症和ADHD诊断的临床研究。

竞争方法：

| 解决方案 | 机构 | 方法 | 主要局限 |
|---|---|---|---|
| BrainNetCNN | 斯坦福大学 | 基于FC的图CNN | 无自监督；需要大量标注数据集 |
| fMRIPrep + 标准MAE | 社区标准 | 预处理 + 标准ViT | 忽略模块化结构；噪声敏感性高 |
| 对比FC（SimCLR变体） | MIT | 对增强FC进行对比学习 | 需要精心设计增强；样本效率低于MAE |
| 双线性MAE（提出方法） | 斯坦福/剑桥 | 网络感知令牌化 | 需要功能图谱；仅限于静息态数据 |

*数据要点：双线性MAE直接解决了现有方法的核心弱点——结构忽视。虽然对比方法显示出潜力，但它们需要2-3倍的数据才能达到双线性MAE的性能，这使得后者在数据稀缺的临床环境中更为实用。*

该团队已与两家医疗设备公司合作：NeuroPace（专注于癫痫闭环神经调控）和Kernel（可穿戴脑成像头盔制造商）。早期试点研究表明，仅凭静息态数据，双线性MAE表征即可预测癫痫发作区，准确率达91%，而标准MAE为78%——这对手术规划而言是关键的改进。

行业影响与市场动态

全球fMRI生物标志物市场预计将从2025年的21亿美元增长到2030年的48亿美元（年复合增长率18%），受人口老龄化和神经退行性疾病患病率上升的推动。然而，该领域一直受到“可重复性危机”的阻碍——许多fMRI生物标志物因样本量小和方法差异而无法在不同站点间复现。双线性MAE通过其数据高效的学习和生物学上合理的表征，直接应对了这一挑战。对于寻求可靠生物标志物的制药公司，以及旨在开发下一代脑机接口的神经技术初创公司，这一方法可能成为改变游戏规则的工具。

时间归档

常见问题

这次模型发布“Brain Network Tokenization: A New Paradigm for fMRI Self-Supervised Learning”的核心内容是什么？

Self-supervised learning on resting-state functional connectivity (FC) matrices has long suffered from a fundamental mismatch: the tokenization process treats the brain as a homoge…

从“bilinear tokenization brain functional connectivity implementation”看，这个模型发布为什么重要？

The core innovation is the bilinear tokenization module, which replaces the standard linear patch embedding or graph convolution front-end in masked autoencoders. Given an FC matrix X ∈ ℝ^{N×N} (N brain regions), the sta…

围绕“masked autoencoder fMRI self-supervised learning tutorial”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。