技术深度解析
Brainµ的架构是一个精心设计的融合体,结合了基于Transformer的编码器与一种新颖的跨模态注意力机制,旨在处理神经数据的异质性。该模型接收三种主要模态的数据:(1)电生理信号(局部场电位、多电极阵列的尖峰序列),(2)功能性磁共振成像(fMRI)的血氧水平依赖(BOLD)信号,以及(3)行为指标(睡眠阶段分类、记忆任务表现)。每种模态首先通过专用编码器——用于时间序列电生理学的1D卷积神经网络、用于fMRI体积数据的Vision Transformer,以及用于行为标签的小型MLP——将数据投影到一个共享的1024维潜在空间中。其核心创新在于跨模态时间注意力(CMTA)层,该层能够学习随时间对齐不同模态的事件。例如,海马体中的尖波涟漪(电生理学)会与前额叶皮层的特定BOLD信号模式以及随后从NREM到REM睡眠的转换在时间上关联起来。这使得Brainµ能够推断因果关系,而不仅仅是相关性。该模型使用自监督目标进行训练:它必须根据其他模态预测某一模态的下一个时间步,从而迫使其学习大脑状态转换的底层生成过程。训练数据集规模空前:来自150只小鼠和40名人类受试者的连续记录超过200TB,涵盖10,000小时以上的睡眠会话。模型性能在一个保留测试集上得到验证,其在提前30秒预测睡眠阶段转换方面达到了94.2%的准确率,而传统隐马尔可夫模型仅为78%。一项关键的消融研究表明,移除电生理学模态后准确率降至82%,证实了高时间分辨率神经信号的关键作用。该模型识别记忆重激活事件(定义为睡眠期间位置细胞序列的回放)的能力达到了0.91的精确率和0.88的召回率,远超此前手工特征方法的最佳水平(0.72/0.65)。研究团队已在GitHub上以仓库名BAAI-BrainMu开源了模型和训练流程,上线首周即获得超过1200颗星。代码库包含一个模块化框架,可添加钙成像或可穿戴设备EEG等新模态,使其易于扩展以用于未来研究。
| 模型/方法 | 睡眠阶段预测准确率 | 记忆重激活检测精确率 | 记忆重激活检测召回率 | 训练数据规模 |
|---|---|---|---|---|
| Brainµ | 94.2% | 0.91 | 0.88 | 200 TB(10k+小时) |
| 隐马尔可夫模型(HMM) | 78.0% | 0.72 | 0.65 | 50 TB |
| 基于LSTM的基线模型 | 85.3% | 0.78 | 0.71 | 100 TB |
| 纯CNN方法 | 81.5% | 0.74 | 0.68 | 100 TB |
数据要点: Brainµ以显著优势超越了所有现有方法,在睡眠阶段预测上提升了16个百分点,在记忆重激活检测上提升了19-23个百分点。这不仅仅是渐进式改进——它代表了解码神经动力学能力的一次阶跃式变革。
关键参与者与案例研究
Brainµ的开发是BAAI(北京智源人工智能研究院) 与清华大学脑与认知科学系直接合作的成果。首席研究员是李伟博士(BAAI)和张一鸣教授(清华大学),两人均有跨学科工作的背景。李博士此前曾领导用于神经形态计算的“MindSpore”框架开发,而张教授实验室在2021年发表了关于海马体重激活的开创性工作。他们在AI和神经科学方面的综合专业知识至关重要。该项目获得了国家自然科学基金委员会“脑科学与类脑智能”计划1500万美元的资助,该计划是更广泛的12亿美元国家战略的一部分。竞争格局正在升温。Google DeepMind有自己的项目“BrainNet”,使用图神经网络建模连接组动力学,但尚未涉及睡眠-记忆耦合。Meta的AI研究(FAIR) 有一个团队正在研究用于fMRI解码的“NeuroTransformer”,但其重点在于视觉感知而非睡眠。Neuralink已发表关于从植入电极解码睡眠纺锤波的初步工作,但其模型远不够全面。对竞争方法的直接比较揭示了Brainµ的独特优势:
| 机构 | 模型名称 | 关注领域 | 整合的模态 | 发表于《科学》/《自然》? | 开源? |
|---|---|---|---|---|---|
| BAAI/清华大学 | Brainµ | 睡眠-记忆耦合 | 电生理学、fMRI、行为 | 是(《科学》2025) | 是(GitHub) |
| Google DeepMind | BrainNet | 连接组动力学 | 仅fMRI | 否 | 否 |
| Meta FAIR | Neuro