光学相干断层成像多尺度融合实现眼病影像高效分析

2026-06-09 来源:本站点击次数:28

光学相干断层扫描（OCT）是眼科诊断的核心无创成像技术，能够提供视网膜高分辨率横截面图像，是糖尿病黄斑水肿、年龄相关性黄斑变性、视网膜静脉阻塞等致盲性眼病诊断和疗效监测的关键手段。但视网膜层结构复杂、病理液体形态多变且边界模糊，传统分割方法存在精度不足、泛化性差、难以区分重叠病变区域等问题，严重影响临床诊断效率和准确性。本文介绍的研究提出了一种自适应多域融合网络（AMDF-Net），通过整合多个先进深度学习模块，实现了视网膜层和病理液体的高精度自动分割，在公开基准数据集和临床实时数据上均取得了领先性能。

本研究由Pavithra Mani、Neelaveni Ramachandran、V. Sowmya、Vinayakumar Ravi、Prasanna Venkatesh Ramesh 及 Tahani Jaser Alahmadi共同完成，论文题为《Multi-scale adaptive fusion network for retinal layer and fluid segmentation in optical coherence tomography B-scans》，于2026年3月在线发表在Nature旗下的Scientific Reports期刊上。

重要发现
01核心技术贡献
本研究的核心贡献在于构建了一种专门针对OCT图像分割痛点的自适应多域融合深度学习架构，系统性解决了现有方法的局限性。该架构包含四个关键创新方向：一是提出动态多域融合的基础框架，突破了传统单一域特征提取的限制，能够同时整合空间和光谱域的互补信息；二是设计混合编解码器结构，通过快速傅里叶编码和多尺度图卷积技术，有效处理复杂液体重叠区域和低对比度视网膜图像；三是引入动态注意力机制，强化了对小尺寸、低对比度病理区域的特征表达，显著提升了边缘分割精度；四是开发边界感知的联合损失函数，同时优化区域分割和边界提取效果，减少了病理液体区域对正常视网膜层分割的干扰。

02图像预处理
为提升OCT图像质量并统一数据分布，研究团队设计了三步标准化预处理流程。首先采用自适应非局部均值滤波抑制散斑噪声，该方法通过计算像素间的相似性权重进行选择性平滑，在去除噪声的同时完整保留视网膜层边界和液体区域的精细结构。其次进行边缘增强，利用Sobel算子计算图像的水平和垂直梯度，放大层间和液体区域的强度变化，突出关键结构特征，降低后续分割模型的学习难度。最后通过直方图匹配统一不同数据集的亮度和对比度分布，消除成像设备和采集参数差异带来的影响，显著提升了模型的跨数据集泛化能力。

03网络架构设计
AMDF-Net采用编码器-解码器的经典结构，核心是混合光谱-空间Transformer 模块。该模块分为空间编码器和光谱编码器两个并行分支：空间编码器使用3×3和5×5卷积核提取不同尺度的局部纹理和边缘特征，能够精准捕捉薄视网膜层和微小液体区域的细节信息；光谱编码器通过快速傅里叶变换将图像转换到频率域，提取全局结构特征和长程依赖关系，有效解决了传统卷积神经网络难以捕捉大范围上下文信息的问题。两个分支的特征通过动态注意力融合模块进行自适应加权融合，该模块同时集成了通道注意力和空间注意力机制，能够自动识别对分割任务最有价值的特征，在弱边界和重叠病变区域表现尤为突出。

此外，网络还包含多尺度图卷积模块和疾病包容性分割单元。多尺度图卷积模块通过三个不同感受野的并行图卷积路径，编码视网膜层之间的空间和层级依赖关系，保证了分割结果的拓扑一致性。疾病包容性分割单元则引入了疾病感知编码机制，通过学习疾病特异性特征，提升了对不同类型病理液体的识别能力，使模型能够同时完成视网膜层分割、液体区域识别和疾病特征提取三个任务。

04损失函数与训练设置
为同时优化区域分割精度和边界清晰度，研究团队设计了一种联合损失函数，由分割损失和轮廓损失两部分组成。其中分割损失融合了Dice损失、交叉熵损失和焦点频率损失，分别解决了类别不平衡、像素分类误差和频率域特征不匹配的问题；轮廓损失则专门针对边界像素进行优化，提升了对细小和弯曲边界的捕捉能力。模型在PyTorch框架下实现，使用NVIDIA RTX A4000 GPU进行训练，针对不同数据集采用了定制化的训练策略，包括图像尺寸调整、数据增强和学习率调度等，确保模型在不同场景下都能稳定收敛。

05实验验证与结果分析
研究团队在三个公开基准数据集和一个临床实时数据集上对AMDF-Net进行了全面评估，涵盖了不同疾病类型、不同成像设备和不同临床场景。评估指标采用Dice相似系数、像素准确率和平衡准确率，分别衡量区域重叠度、像素分类精度和类别不平衡情况下的整体性能。实验结果显示，AMDF-Net在所有数据集上均显著优于现有主流方法，在糖尿病黄斑水肿数据集上的平均平衡准确率达到85.34%，在病理液体分割挑战赛数据集上的平均Dice相似系数达到87.1%，在临床实时数据集上的平均Dice相似系数达到88.1%。

消融实验进一步验证了各模块的有效性：快速傅里叶编码模块将液体区域识别精度提升了21.9%，多尺度图卷积模块将视网膜层分割精度提升了2.2%。计算复杂度分析表明，这两个模块的计算开销较低，不会显著增加模型推理时间，完全满足临床实时应用的需求。此外，跨厂商泛化性测试显示，AMDF-Net在不同厂商的OCT设备数据上均能保持稳定的性能，证明了其广泛的临床适用性。

创新与亮点
本研究突破了OCT图像分割领域的多个核心难题，包括散斑噪声干扰、低对比度病理边缘、重叠液体区域难以区分、传统模型长程依赖捕捉不足和跨数据集泛化性差等问题。研究首次提出了混合光谱-空间Transformer架构，实现了全局上下文和局部细节的同步提取；设计了动态注意力融合模块，能够自适应平衡不同域特征的贡献；引入了疾病包容性分割单元，将疾病信息整合到分割过程中；提出了边界感知联合损失函数，同时优化区域和边界分割效果。

该技术在光学生物医疗领域具有重要的实际价值：在临床诊断中，能够自动、精准地分割视网膜层和病理液体，帮助医生快速完成疾病筛查和严重程度评估；在治疗监测中，能够定量测量液体体积变化，客观评价治疗效果；在科研中，能够为大规模OCT图像分析提供高效工具，加速视网膜疾病的发病机制研究。同时，该技术适用于不同厂商的OCT设备，在基层医疗机构等资源有限的场景中也具有广阔的应用前景。

总结与展望
本研究提出的AMDF-Net通过多模块协同创新，有效解决了OCT图像视网膜层和病理液体分割的关键技术难题，在多个基准数据集和临床数据上取得了领先性能，为自动化视网膜疾病分析提供了强有力的技术支撑。未来研究将聚焦于模型轻量化优化，通过量化和剪枝技术降低计算复杂度，同时扩展到三维OCT体积数据分割，进一步提升临床实用性和适用范围。

论文信息
声明：本文仅用作学术目的。
Mani P, Ramachandran N, Sowmya V, Ravi V, Ramesh PV, Alahmadi TJ. Multi-scale adaptive fusion network for retinal layer and fluid segmentation in optical coherence tomography B-scans. Sci Rep. 2026 Mar 30;16(1):10600.

DOI:10.1038/s41598-026-44006-5.

相关公司：罗辑技术（武汉）有限公司
联系电话：13260667811
邮箱: logiscience@163.com