光学相干断层扫描(OCT)是眼科诊断的核心无创成像技术,能够提供视网膜高分辨率横截面图像,是糖尿病黄斑水肿、年龄相关性黄斑变性、视网膜静脉阻塞等致盲性眼病诊断和疗效监测的关键手段。但视网膜层结构复杂、病理液体形态多变且边界模糊,传统分割方法存在精度不足、泛化性差、难以区分重叠病变区域等问题,严重影响临床诊断效率和准确性。本文介绍的研究提出了一种自适应多域融合网络(AMDF-Net),通过整合多个先进深度学习模块,实现了视网膜层和病理液体的高精度自动分割,在公开基准数据集和临床实时数据上均取得了领先性能。
本研究由Pavithra Mani、Neelaveni Ramachandran、V. Sowmya、Vinayakumar Ravi、Prasanna Venkatesh Ramesh 及 Tahani Jaser Alahmadi共同完成,论文题为《Multi-scale adaptive fusion network for retinal layer and fluid segmentation in optical coherence tomography B-scans》,于2026年3月在线发表在Nature旗下的Scientific Reports期刊上。
重要发现
01核心技术贡献
本研究的核心贡献在于构建了一种专门针对OCT图像分割痛点的自适应多域融合深度学习架构,系统性解决了现有方法的局限性。该架构包含四个关键创新方向:一是提出动态多域融合的基础框架,突破了传统单一域特征提取的限制,能够同时整合空间和光谱域的互补信息;二是设计混合编解码器结构,通过快速傅里叶编码和多尺度图卷积技术,有效处理复杂液体重叠区域和低对比度视网膜图像;三是引入动态注意力机制,强化了对小尺寸、低对比度病理区域的特征表达,显著提升了边缘分割精度;四是开发边界感知的联合损失函数,同时优化区域分割和边界提取效果,减少了病理液体区域对正常视网膜层分割的干扰。
此外,网络还包含多尺度图卷积模块和疾病包容性分割单元。多尺度图卷积模块通过三个不同感受野的并行图卷积路径,编码视网膜层之间的空间和层级依赖关系,保证了分割结果的拓扑一致性。疾病包容性分割单元则引入了疾病感知编码机制,通过学习疾病特异性特征,提升了对不同类型病理液体的识别能力,使模型能够同时完成视网膜层分割、液体区域识别和疾病特征提取三个任务。
04损失函数与训练设置消融实验进一步验证了各模块的有效性:快速傅里叶编码模块将液体区域识别精度提升了21.9%,多尺度图卷积模块将视网膜层分割精度提升了2.2%。计算复杂度分析表明,这两个模块的计算开销较低,不会显著增加模型推理时间,完全满足临床实时应用的需求。此外,跨厂商泛化性测试显示,AMDF-Net在不同厂商的OCT设备数据上均能保持稳定的性能,证明了其广泛的临床适用性。
创新与亮点
本研究突破了OCT图像分割领域的多个核心难题,包括散斑噪声干扰、低对比度病理边缘、重叠液体区域难以区分、传统模型长程依赖捕捉不足和跨数据集泛化性差等问题。研究首次提出了混合光谱-空间Transformer架构,实现了全局上下文和局部细节的同步提取;设计了动态注意力融合模块,能够自适应平衡不同域特征的贡献;引入了疾病包容性分割单元,将疾病信息整合到分割过程中;提出了边界感知联合损失函数,同时优化区域和边界分割效果。
该技术在光学生物医疗领域具有重要的实际价值:在临床诊断中,能够自动、精准地分割视网膜层和病理液体,帮助医生快速完成疾病筛查和严重程度评估;在治疗监测中,能够定量测量液体体积变化,客观评价治疗效果;在科研中,能够为大规模OCT图像分析提供高效工具,加速视网膜疾病的发病机制研究。同时,该技术适用于不同厂商的OCT设备,在基层医疗机构等资源有限的场景中也具有广阔的应用前景。
总结与展望
本研究提出的AMDF-Net通过多模块协同创新,有效解决了OCT图像视网膜层和病理液体分割的关键技术难题,在多个基准数据集和临床数据上取得了领先性能,为自动化视网膜疾病分析提供了强有力的技术支撑。未来研究将聚焦于模型轻量化优化,通过量化和剪枝技术降低计算复杂度,同时扩展到三维OCT体积数据分割,进一步提升临床实用性和适用范围。
DOI:10.1038/s41598-026-44006-5.