文章

光学相干断层成像多尺度融合实现眼病影像高效分析

2026-06-09     来源:本站     点击次数:28

光学相干断层扫描(OCT)是眼科诊断的核心无创成像技术,能够提供视网膜高分辨率横截面图像,是糖尿病黄斑水肿、年龄相关性黄斑变性、视网膜静脉阻塞等致盲性眼病诊断和疗效监测的关键手段。但视网膜层结构复杂、病理液体形态多变且边界模糊,传统分割方法存在精度不足、泛化性差、难以区分重叠病变区域等问题,严重影响临床诊断效率和准确性。本文介绍的研究提出了一种自适应多域融合网络(AMDF-Net),通过整合多个先进深度学习模块,实现了视网膜层和病理液体的高精度自动分割,在公开基准数据集和临床实时数据上均取得了领先性能。

本研究由Pavithra Mani、Neelaveni Ramachandran、V. Sowmya、Vinayakumar Ravi、Prasanna Venkatesh Ramesh 及 Tahani Jaser Alahmadi共同完成,论文题为《Multi-scale adaptive fusion network for retinal layer and fluid segmentation in optical coherence tomography B-scans》,于2026年3月在线发表在Nature旗下的Scientific Reports期刊上。

重要发现
01核心技术贡献
本研究的核心贡献在于构建了一种专门针对OCT图像分割痛点的自适应多域融合深度学习架构,系统性解决了现有方法的局限性。该架构包含四个关键创新方向:一是提出动态多域融合的基础框架,突破了传统单一域特征提取的限制,能够同时整合空间和光谱域的互补信息;二是设计混合编解码器结构,通过快速傅里叶编码和多尺度图卷积技术,有效处理复杂液体重叠区域和低对比度视网膜图像;三是引入动态注意力机制,强化了对小尺寸、低对比度病理区域的特征表达,显著提升了边缘分割精度;四是开发边界感知的联合损失函数,同时优化区域分割和边界提取效果,减少了病理液体区域对正常视网膜层分割的干扰。

02图像预处理
为提升OCT图像质量并统一数据分布,研究团队设计了三步标准化预处理流程。首先采用自适应非局部均值滤波抑制散斑噪声,该方法通过计算像素间的相似性权重进行选择性平滑,在去除噪声的同时完整保留视网膜层边界和液体区域的精细结构。其次进行边缘增强,利用Sobel算子计算图像的水平和垂直梯度,放大层间和液体区域的强度变化,突出关键结构特征,降低后续分割模型的学习难度。最后通过直方图匹配统一不同数据集的亮度和对比度分布,消除成像设备和采集参数差异带来的影响,显著提升了模型的跨数据集泛化能力。

03网络架构设计
AMDF-Net采用编码器-解码器的经典结构,核心是混合光谱-空间Transformer 模块。该模块分为空间编码器和光谱编码器两个并行分支:空间编码器使用3×3和5×5卷积核提取不同尺度的局部纹理和边缘特征,能够精准捕捉薄视网膜层和微小液体区域的细节信息;光谱编码器通过快速傅里叶变换将图像转换到频率域,提取全局结构特征和长程依赖关系,有效解决了传统卷积神经网络难以捕捉大范围上下文信息的问题。两个分支的特征通过动态注意力融合模块进行自适应加权融合,该模块同时集成了通道注意力和空间注意力机制,能够自动识别对分割任务最有价值的特征,在弱边界和重叠病变区域表现尤为突出。

此外,网络还包含多尺度图卷积模块和疾病包容性分割单元。多尺度图卷积模块通过三个不同感受野的并行图卷积路径,编码视网膜层之间的空间和层级依赖关系,保证了分割结果的拓扑一致性。疾病包容性分割单元则引入了疾病感知编码机制,通过学习疾病特异性特征,提升了对不同类型病理液体的识别能力,使模型能够同时完成视网膜层分割、液体区域识别和疾病特征提取三个任务。

04损失函数与训练设置
为同时优化区域分割精度和边界清晰度,研究团队设计了一种联合损失函数,由分割损失和轮廓损失两部分组成。其中分割损失融合了Dice损失、交叉熵损失和焦点频率损失,分别解决了类别不平衡、像素分类误差和频率域特征不匹配的问题;轮廓损失则专门针对边界像素进行优化,提升了对细小和弯曲边界的捕捉能力。模型在PyTorch框架下实现,使用NVIDIA RTX A4000 GPU进行训练,针对不同数据集采用了定制化的训练策略,包括图像尺寸调整、数据增强和学习率调度等,确保模型在不同场景下都能稳定收敛。

05实验验证与结果分析
研究团队在三个公开基准数据集和一个临床实时数据集上对AMDF-Net进行了全面评估,涵盖了不同疾病类型、不同成像设备和不同临床场景。评估指标采用Dice相似系数、像素准确率和平衡准确率,分别衡量区域重叠度、像素分类精度和类别不平衡情况下的整体性能。实验结果显示,AMDF-Net在所有数据集上均显著优于现有主流方法,在糖尿病黄斑水肿数据集上的平均平衡准确率达到85.34%,在病理液体分割挑战赛数据集上的平均Dice相似系数达到87.1%,在临床实时数据集上的平均Dice相似系数达到88.1%。

消融实验进一步验证了各模块的有效性:快速傅里叶编码模块将液体区域识别精度提升了21.9%,多尺度图卷积模块将视网膜层分割精度提升了2.2%。计算复杂度分析表明,这两个模块的计算开销较低,不会显著增加模型推理时间,完全满足临床实时应用的需求。此外,跨厂商泛化性测试显示,AMDF-Net在不同厂商的OCT设备数据上均能保持稳定的性能,证明了其广泛的临床适用性。

创新与亮点
本研究突破了OCT图像分割领域的多个核心难题,包括散斑噪声干扰、低对比度病理边缘、重叠液体区域难以区分、传统模型长程依赖捕捉不足和跨数据集泛化性差等问题。研究首次提出了混合光谱-空间Transformer架构,实现了全局上下文和局部细节的同步提取;设计了动态注意力融合模块,能够自适应平衡不同域特征的贡献;引入了疾病包容性分割单元,将疾病信息整合到分割过程中;提出了边界感知联合损失函数,同时优化区域和边界分割效果。

该技术在光学生物医疗领域具有重要的实际价值:在临床诊断中,能够自动、精准地分割视网膜层和病理液体,帮助医生快速完成疾病筛查和严重程度评估;在治疗监测中,能够定量测量液体体积变化,客观评价治疗效果;在科研中,能够为大规模OCT图像分析提供高效工具,加速视网膜疾病的发病机制研究。同时,该技术适用于不同厂商的OCT设备,在基层医疗机构等资源有限的场景中也具有广阔的应用前景。

总结与展望
本研究提出的AMDF-Net通过多模块协同创新,有效解决了OCT图像视网膜层和病理液体分割的关键技术难题,在多个基准数据集和临床数据上取得了领先性能,为自动化视网膜疾病分析提供了强有力的技术支撑。未来研究将聚焦于模型轻量化优化,通过量化和剪枝技术降低计算复杂度,同时扩展到三维OCT体积数据分割,进一步提升临床实用性和适用范围。

论文信息
声明:本文仅用作学术目的。
Mani P, Ramachandran N, Sowmya V, Ravi V, Ramesh PV, Alahmadi TJ. Multi-scale adaptive fusion network for retinal layer and fluid segmentation in optical coherence tomography B-scans. Sci Rep. 2026 Mar 30;16(1):10600.  

DOI:10.1038/s41598-026-44006-5.

相关文章 更多 >