技术深度解析
基于距离的不确定性量化方法代表了从贝叶斯神经网络和集成方法的范式转变。其核心是将训练模型的知识视为高维特征空间中的一个几何区域。不确定性因此不再是一个需要推断的概率,而是一个可以测量的距离。
架构基础: 大多数实现都建立在特征提取器之上——通常是深度神经网络的倒数第二层——它将输入数据转换为潜在表示。已知的训练数据在此空间中形成一个流形或簇。对于新的输入,系统计算其到该流形的距离。常用的距离度量包括马氏距离(考虑特征协方差)、潜在空间中的k近邻距离,或者来自为建模分布内数据而训练的自编码器的重构误差。
一个领先的实现是深度马氏距离检测器,由Kimin Lee和Kibok Lee等研究者推广。该方法为每个类别的训练数据特征拟合一个类条件高斯分布。在推理时,测试样本特征到最近的类条件高斯分布的马氏距离,为检测分布外样本提供了一个分数——这是高认知不确定性的一个代理指标。
另一个有影响力的架构是基于标准化流的检测器。像`pyknos`和`nflows`这样的GitHub仓库提供了训练灵活概率分布的工具。通过学习将复杂的数据分布转换为简单的分布(如标准高斯分布),这些流可以计算新数据点在已学习训练分布下的精确似然。非常低的似然值表明高认知不确定性。`FrEIA`(易于逆架构框架)仓库是一个值得注意的基于PyTorch的工具包,在构建此类基于流的OOD检测器方面日益受到关注。
性能基准测试: 距离方法的有效性在标准化的OOD检测任务上进行衡量,例如将CIFAR-10测试图像(分布内)与SVHN或TinyImageNet样本(分布外)区分开来。
| 方法 | 架构 | AUROC (CIFAR-10 vs SVHN) | FPR@95% TPR | 推理速度 (ms/样本) |
|---|---|---|---|---|
| 深度马氏距离 | WideResNet | 98.2% | 12.1% | ~5 |
| 似然比 (Flow) | Glow + 分类器 | 99.1% | 4.8% | ~50 |
| 集成 (5模型) | ResNet-50 | 95.7% | 21.5% | ~100 |
| 蒙特卡洛Dropout | DenseNet | 92.3% | 35.2% | ~15 |
数据要点: 与蒙特卡洛Dropout等传统的贝叶斯近似方法相比,基于距离的方法,特别是基于流的似然模型,实现了更优的分布外检测性能(更高的AUROC,更低的误报率)。然而,这是以计算成本为代价的,在准确性和延迟之间形成了明确的权衡,这对实时应用至关重要。
数学上的严谨性来自于将这些距离与明确定义的不确定性度量联系起来。对于一个分类器 f(x) 和特征提取器 φ(x),认知不确定性 U_epistemic(x) 可以形式化为:
U_epistemic(x) = g( d( φ(x), M_train ) )
其中 d 是距离度量,M_train 是特征空间中的训练数据流形,g 是一个缩放函数。这与偶然不确定性清晰地区分开来,后者被建模为对于*位于* M_train *内*的输入,f(x) 的熵。
关键参与者与案例研究
这项发展由具有即时部署需求的学术先驱和行业实验室共同推动。
学术先锋:
* Yarin Gal(牛津大学)虽然以贝叶斯深度学习闻名,但最近强调了其局限性以及对更好OOD检测的需求,间接验证了基于距离的方法。
* Balaji Lakshminarayanan(Google Brain)及其团队在*“使用深度集成进行简单且可扩展的预测不确定性估计”*方面的工作奠定了重要的比较基线,但该团队的新工作正在探索混合距离-概率方法。
* Jens Lehmann和波恩大学的研究人员正在将这些原理应用于分子属性预测的几何深度学习,其中关于新化合物结构的不确定性是药物发现的主要瓶颈。
行业应用:
* Waymo和Cruise已将先进的不确定性量化流程集成到它们的感知系统中。据报道,Waymo的“鸟瞰图”网络现在包含一个专用的“新颖性评分”模块,该模块使用潜在距离度量来标记罕见或未见过的物体配置,从而触发更保守的规划。
* Siemens Healthineers在其AI-Rad Companion放射学软件中采用了类似的概念。该系统使用变分自编码器来学习正常和病理解剖结构的紧凑表示。重构误差或潜在空间距离被用来量化模型对异常发现的置信度,为放射科医生提供不确定性估计。