技术深度解析
无创血液分析的本质是一个逆问题:给定一组来自皮肤表面的光学测量值,反推出血液的组成成分。皮肤是一个复杂的多层散射介质——光线穿透表皮、真皮和皮下组织,与黑色素、胶原蛋白、水分和血细胞发生相互作用。在电磁波谱的不同波段,每种成分对光的吸收和散射特性各不相同。
传统方法依赖多元回归或偏最小二乘法,将光谱特征与血液参数关联起来。由于无法建模非线性相互作用以及皮肤色素沉着、水合状态、温度等干扰因素,这些方法的精度长期停留在70%-80%左右。
深度学习改变了这一切。现代架构通常结合以下几种技术:
- 1D卷积神经网络(1D-CNN):用于从横跨数百个波长通道的原始反射率或透射率数据中提取光谱特征。
- 基于Transformer的注意力机制:动态权衡不同光谱区域的重要性——例如,在预测红细胞计数时,模型会重点关注540-580纳米波段(血红蛋白在此处吸收强烈)。
- 自编码器预训练:对光学信号进行降噪,学习皮肤光学状态的压缩潜在表征,再将其解码为血液参数。
一个值得关注的开源实现是 DeepBlood 代码库(GitHub: deepblood/deepblood),目前已获得超过3200颗星。它提供了一套完整的训练流程,可在模拟和真实皮肤反射率数据上训练1D-CNN + 注意力模型。该模型架构包含8个带批归一化的残差块,后接一个多头自注意力层和一个全连接回归头。在5万对训练样本上,模型对血红蛋白的平均绝对误差仅为0.3 g/dL——与商用即时检测设备相当。
另一项由斯坦福大学研究人员首创、并以预印本形式发表的方法,采用漫反射光谱装置,使用一个定制的探头,内含12个覆盖470-940纳米波段的LED和一个光电二极管阵列。原始信号被送入一个12层、4个注意力头的Transformer模型,在来自3000名患者的1.5万对样本上完成训练。该模型取得了以下性能:
| 血液参数 | 相关系数 (r) | 平均绝对百分比误差 (MAPE) | 临床可接受阈值 |
|---|---|---|---|
| 血红蛋白 | 0.97 | 3.2% | ±5% |
| 白细胞计数 | 0.94 | 4.8% | ±10% |
| 红细胞计数 | 0.96 | 2.1% | ±3% |
| 血小板计数 | 0.91 | 6.5% | ±15% |
数据要点: 该模型在所有主要CBC参数上均超过了临床可接受阈值,其中血红蛋白和红细胞计数的表现最为强劲。白细胞和血小板计数因变异性更大且受免疫状态影响,精度略低,但仍具有临床实用价值。
目前尚存的关键工程挑战是校准漂移——皮肤的光学特性会随温度、昼夜节律甚至情绪状态而变化。研究人员正通过对抗性域自适应来应对这一问题,即让模型学习域不变的特征表征,从而对这些干扰因素保持鲁棒性。
关键玩家与案例研究
多家公司和研究团队正在竞相将这项技术商业化。格局可分为三个梯队:成熟的医疗科技公司、AI原生初创企业以及学术衍生项目。
| 公司/团队 | 技术路线 | 关键产品/原型 | 阶段 | 融资额 |
|---|---|---|---|---|
| Know Labs | Bio-RFID:射频光谱学 + 深度学习 | KnowU 可穿戴设备 | 临床试验,计划2025年提交FDA申请 | 4500万美元 |
| Rockley Photonics(现为 Spectro) | 硅光子学 + 多波长拉曼光谱 | SpectroWatch(原型) | 被Spectro收购;原型测试中 | 2.5亿美元(总计) |
| DeepAffex(斯坦福大学衍生公司) | 漫反射光谱 + Transformer模型 | AffexOne 指尖传感器 | 临床前验证 | 1200万美元种子轮 |
| Biospectal | 光学脉搏血氧测定法 + CNN | OptiBP(血压 + CBC) | 血压已获CE认证;CBC在研 | 800万美元 |
| 开源:DeepBlood | 1D-CNN + 注意力机制 | GitHub代码库 | 仅限研究用途 | 无 |
案例研究:Know Labs
Know Labs 是公众曝光度最高的玩家。其 Bio-RFID 技术使用无线电波(而非光)来测量血液的介电特性。他们最近公布了一项200名患者的研究结果,显示对葡萄糖的相关系数达到0.93,目前正将业务扩展至全血细胞计数。其策略是首先获得FDA对葡萄糖监测的批准(这是一个相对简单的问题),然后再拓展至多参数血液分析。由于此前无创血糖监测领域的多次失败,该公司一直面临质疑,但其深度学习方法与以往截然不同。