文章

空间多组学研究思路分享(三):利用AI算法预测空间生物标志物

2025-11-04     来源:本站     点击次数:28

空间多组学技术与人工智能的融合正开启生物标志物挖掘的新范式。本文分享了构建AI驱动型空间标志物预测模型的研究思路,通过整合高精度空间转录组数据与机器学习算法,实现了从组织微环境到临床预测的系统性跨越。该研究思路不仅突破传统标志物筛选的局限,更通过空间维度特征提取,为疾病分层与复发预测等工作提供全新解决方案。

一. 研究思路

【芯空一号快讯】空间多组学研究思路分享(三):利用AI算法预测空间生物标志物
 
二. 研究思路详解

1、根据模型的预测目的,提取合适的组织切片样品。例如,如果要预测疾病分层,就要获取包含不同疾病分期病灶区的组织样品,和非病灶区域样品。如果要预测复发不复发,就要分别获取复发与未复发的肿瘤组织样品等等。然后,使用空间转录组检测技术(10x Visium、CosMx SMI)获得基因的空间表达图谱。
 
图片图1 空间转录组聚类结果示例

 
2、收集组织中主要细胞类型的经典特异性marker基因,进行基因集打分,确认细胞相对丰度。比较不同区域/分组中各细胞类型的丰度,筛选具有显著差异的细胞类型,结合先验知识,锁定候选细胞类型。对候选细胞类型进行细分,进一步锁定更重要的候选细胞亚型。

图片图2 基于marker基因集打分筛选候选细胞亚型

3、从候选细胞亚型中筛选候选的标志物基因。通过差异分析(候选细胞亚型vs其他细胞类型、候选细胞亚型在不同区域的差异比较等)获得初步的候选基因集。使用广义线性模型基于基因集的表达水平进一步筛选候选标志物基因,随后用机器学习模型如XGboost等,结合基因的空间位置信息构建预测模型,并设计评分系统。
 

图片图3 筛选候选标志物基因并基于空间表达信息构建预测模型

4、扩大队列,评估模型性能。在大队列样品中测试模型性能,将评分与多种临床因素指标进行多变量回归分析。此外,可将该模型的评估效果与其他判别方法进行比较,确认构建模型的性能强弱。
 

图片图4 在大队列样品中评估模型的预测性能并与其他方法比较

5、分析用于构建模型的标志物基因和表达标志物基因的候选细胞亚型,确认在疾病进展中发挥的功能。使用细胞互作分析和功能验证实验,为新疗法开发找寻潜在的细胞或基因靶点。

三. 案例分享
 

图片

空间免疫评分系统预测肝细胞癌复发
期刊:Nature 
影响因子:48.5     
发表时间:2025.04

本研究对61例患者的肿瘤侵袭前沿及瘤中心区域进行分析,发现自然杀伤(NK)细胞呈现与HCC复发相关的空间特异性分布。基于五种生物标志物的空间表达模式,采用极限梯度提升算法与逆方差加权法,构建了肿瘤免疫微环境空间(TIMES)评分模型用于预测HCC复发风险。该TIMES评分在患者风险分层中的表现优于当前标准工具(包括TNM分期系统和BCLC分期系统)。我们在来自五个多中心队列的231例患者中对模型进行了验证,其在实际临床中的准确率达82.2%,特异性达85.7%。这些生物标志物的预测效力源于其空间分布特征的整合,而非单一标志物的表达水平。体内模型揭示,SPON2(五种标志物之一)可增强侵袭前沿区域的IFNγ分泌及NK细胞浸润。本研究推出的TIMES评分工具可用于预测HCC复发风险,为早期HCC治疗决策提供了潜在的参考依据。
 

图片图5 研究设计

参考文献:
Jia, Gengjie et al. “Spatial immune scoring system predicts hepatocellular carcinoma recurrence.” Nature vol. 640,8060 (2025): 1031-1041.
相关文章 更多 >