文章

模拟模型与软件系统助力开发优化CASA系统及算法

2025-11-03     来源:本站     点击次数:39

测试设置

在实验测试中,我们基于真实精液样本图像进行模拟。本研究使用的精液样本由我们为先前研究「3、4」采集,并已公开发布于「35」。样本图像由宾夕法尼亚生育中心的体外受精实验室提供。每个样本在室温下液化30-40分钟后,用培养液进行清洗。清洗后的精液样本被移液至20微米深的Vitrolife MicroCell培养腔室进行数据采集。关于样本制备流程的详细说明,请参阅Urbano等人的研究「3、4」。

我们从真实图像中提取的参数包括:图像背景 BL、噪声方差σ2N、精子头部尺寸、图像中细胞 数量N静止细胞数量N

测试

我们对模拟实验的两个应用场景进行了探索。首先,我们测试了五种精子细胞检测算法并评估了其性能表现。这些细胞检测算法包含两大核心模块:分割与定位「39」。其中分割模块负责将图像中含精子细胞的区域从整体分离,定位模块则对分割区域内的精子细胞进行精确定位。

评估指标包括*优子模式分配(OSPA)距离(c= 20, 1 = 2)「44」、精确率和召回率「45」。OSPA距离是一种量化指标,用于衡量真实值与检测结果之间的距离误差及数量差异(即真实值与检测值的数量差)。

精确率是指真阳性(正确匹配)数量占总检测数的比例,召回率则是真阳性数量占真实值总数的比例。理想情况下,OSPA距离值应趋近于0,而精确率和召回率则应接近1。通过人工标记精子的位置,可以计算出真实样本中的OSPA distance、精度和召回率。

其次,我们测试了四种精子追踪算法(最近邻(NN)、全局最近邻(GNN)、概率数据关联过滤 器(PDAF)和联合概率数据关联过滤器(JPDAF))「46」。

追踪算法的核心目标是实时监测精子细胞的运动轨迹。通过计算轨迹数据,系统可生成描述精液样本中精子活动能力的关键参数(如活动精子比例、精子移动速度等)。评估算法性能时,采用多目标追踪精度(MOTP)和多目标追踪准确度(MOTA)作为指标,其中截断距离设定为5像素「47像素」。MO-TP通过累加匹配基准轨迹truth__与检测轨迹之间的距离得出,而MOTA则量化了误报(FP)、漏检(MME)和轨迹不匹配的综合误差,其计算公式为MOTA =-(FP++M+MME) 。

理想情况下,MOTP值应趋近于零,MOTA值为1(即FP=M=MME=)。具体评估指标的详细说明请参阅补充文件 [见补充文件1]。

应用该模拟技术评估分割、定位和跟踪。真实精液

研究人员使用五种不同的检测算法(包括分割和定位)对图像及其模拟图像进行了测试。具体算法如下:

1.(Otsu)使用Otsu阈值法对图像进行二值化,随后进行形态学增强(闭运算、膨胀和腐蚀)「48」。

2. 使用Bradley「49」的自适应阈值法对图像进行(自适应)二值化,将灵敏度定义为「0.8」,然后进行形态学增强(闭运算、膨胀和腐蚀)。

3.(斑点增强)使用大津阈值法对斑点增强图像进行二值化处理,随后进行形态学增强(闭运算、膨胀和腐蚀)(方法由Urbano等人「3」提出)。

4.(边缘检测)使用Sobel算子(改进自Abbiramy和Shanthi(2010)提出的算法「5」)对中值滤波后的图像进行边缘检测,随后进行形态学增强处理(膨胀、闭运算和腐蚀)。

5. (GMM)使用高斯混合模型(GMM)的运动检测算法,将训练帧数设置为20 ,混合模型中的高斯模式数量设置为3,学习率设置为0.005,背景比例设置为0.7「50」,随后进行形态学增强(闭运算、膨胀和腐蚀)。

我们基于真实人体样本(样本1)的参数生成了20组不同模拟图像用于测试,图像帧尺寸设定为 250×250像素。在模拟图像中,静止细胞被建模为不动状态,而移动细胞(数量C-ND)则分为线性匀速游动(50%)和圆形游动(50%)两种类型。算法在真实图像和模拟图像上均进行了测试。针对每组图像(真实与模拟),我们添加了方差范围0-1225的零均值高斯噪声(灰度图像标准差为35)。图18展示了真实与模拟图像在不同噪声水平下的OSPA距离、精确率和召回率对比结果。

图中显示,自适应算法在低噪声水平(噪声方差约低于600)下在OSPA(与真实值的最小距离)方面表现*佳,其次是斑点增强算法、边缘检测算法、GMM算法和大津算法(图18a,b)。

在精度表现方面,当噪声水平分别超过100和300的方差阈值时,大津算法和斑点增强算法会出现 明显的性能下降。自适应算法和边缘检测算法的精度同样会随着噪声水平升高而降低,其中边缘检测算法在高噪声环境(约超过600噪声方差阈值)下展现出比自适应算法更强的抗干扰能力。而高斯混合模型算法则展现出*强的抗干扰能力,其精度表现几乎未受影响(误报率极低)。

在噪声恢复性能方面,自适应算法、局部增强算法和边缘检测算法在噪声方差0-1225范围内表现基本持平。而大津算法和高斯混合模型(GMM)则随着噪声水平升高出现性能衰减:大津算法在噪声方差达到100时性能骤降,GMM算法在噪声方差0-1225范围内则呈现渐进式性能下降。

五种不同算法在真实样本图像及其模拟图像上的OSPA距离、精度和召回率均呈现相似趋势。总体 而言, 自适应算法在低噪声水平(低于600噪声方差)时表现*佳,边缘检测算法则在高噪声水平(超过600噪声方差)时表现*优。大津算法表现最差。斑点增强算法在低噪声环境下表现良好,但当噪声水平超过300噪声方差时便失效。高斯混合模型算法在精度方面表现*佳,但在OSPA距离和召回率指标上表现欠佳。另一真实人体样本(样本2)的补充结果详见附加文件[参见附加文件1]。

应用仿真评估跟踪性能。四种跟踪算法(NN 、GNN 、PDAF和(JPDAF)在模拟图像上进行了测试。跟踪算法的代码由莱昂纳多·乌尔巴诺编写,可在乌尔巴诺等人的「51」中获取。每个跟踪算法的输出结果是精液图像中所有检测到细胞的轨迹信息。

我们评估了NN、GNN、PDAF和JPDAF算法在不同细胞数量下的性能表现。

每个模拟图像包含20、40、100或200个细胞。每个图像中的每个细胞都被分配到一种游动类型 中。using equalprobabilities: linear mean swim, circular swim, hyperactive swim,视频帧尺 寸为500×500像素,帧率设定为15帧/秒,每帧图像选取10秒用于追踪分析。针对不同数量的细胞样本,共生成20种不同场景,总计100帧图像。背景亮度设置为204(255级的80%),且视频图像未添加任何噪声。

图18

图18.不同水平加性高斯噪声(a、c、e)下样本1的OSPA距离、精度和召回率,真实数据(b、d、f)与仿真结果对比。

生成图像所用的仿真参数如表6所示。仿真提供了每张图像的真实轨迹,并与通过NN、GNN、PD-AF和JPDAF算法计算出的估计轨迹进行了比较。

表7展示了不同图像类型(细胞数量分别为20、40、100和200个)下20种场景的平均多目标跟踪精度(MOTP)、误检率(FP)、漏检率(M)、多目标错误匹配率(MME)及多目标平均精度(MOTA)等指标。研究发现,四种多目标追踪算法的MOTP值基本保持稳定,不受图像中细胞数量变化的影响。但随着细胞数量的增加,多目标精度(MOTA)呈现下降趋势,同时误检率(FP)、漏检率(M)和错误匹配率(MME)则相应上升。

在大规模细胞追踪任务中,图神经网络(GNN)和JPDAF算法的平均目标精度(MOTA)表现优于传统神经网络(NN)和PDAF跟踪算法。这种差异的主要成因在于误报率(FP)。通过对比实验结果发现,在所有测试场景(20、40、100及200个细胞)中,PDAF算法的MOTA值均低于NN算法。

 

表6.跟踪评估使用的模拟参数

 

表7.NN 、GNN 、PDAF和JPDAF算法在不同数量的小区上的跟踪性能。

在MOTA指标上,GNN和JDPAF跟踪算法表现相近。总体而言,GNN和JPDAF算法表现*佳,其次是 NN算法,而PDAF跟踪算法则表现最差。

结论

我们构建了一个二维(俯视)视角的精子细胞模型,并通过观察真实人类精子的游动轨迹,生成了四种不同的游动模式。该模拟系统为系统研究和比较不同精液图像处理算法提供了可能,包括分割、定位和追踪算法。在实验中,我们测试了五种不同的分割与定位算法,并利用模拟结果对算法性能进行排序,其排序结果与使用真实图像的排序结果高度相似。此外,我们通过运动学指标(MOT)对四种不同追踪算法(神经网络、图神经网络、PDAF和JPDAF)在模拟图像上的表现进行对比,并根据其性能进行了排序。

本文提出的模拟模型与软件系统,为开发优化CASA(计算机辅助精液分析)系统及算法提供了全 新利器。借助这一创新工具,我们能够构建更强大、更稳定的CASA系统。相较于传统人工精液采集与分析,这种系统堪称理想替代方案。具体而言,临床医生可生成并展示多种精液样本的模拟图像供学生和技术人员观摩——整个过程无需人工采集、处理和记录精液样本图像。通过将技术人员的实际分析结果与模拟系统的基准数据进行比对,这套系统还能有效提升操作人员的专业技能。

数据可用性

相关文章 更多 >