文章

deep高深度血液蛋白质组助力酒精相关性肝病蛋白标志物筛选

2023-04-14     来源:鹿明生物     点击次数:679

精性肝病(ALD)是一种常见的慢性肝病,经常导致肝硬化。目前,大约75%的酒精性肝病患者是在肝硬化失代偿期后被诊断出来,已经错过了最佳药物治疗的时期。在早期无症状阶段发现酒精性肝病可以为减缓或预防疾病进展提供机会,但早期诊断具有挑战性。肝病的准确诊断需要活检,有一定的风险,而现有的非侵入性生物标志物在疾病早期的准确性有限,影响了疾病的及时发现和早期干预。
 

基于质谱的蛋白质组学的最新进展极大地扩展了其在生物医学和临床研究中的影响力。作者对人肝脏和血浆这两种类型样本进行单独及综合的分析,以病理特征和疾病阶段依赖性的方式系统地表征肝脏和血浆中的蛋白质组变化然后通过将机器学习,确定了用于同时检测“显著”纤维化(纤维化阶段≥F2),轻度炎症活动和任何脂肪变性的生物标志物组合。

 

本篇由德国马普生物化学研究所Matthias Mann教授联合Aleksander Krag教授课题组在Nature Medicine医学一区期刊(IF:87.241)上发表的题为 “Noninvasive proteomic biomarkers for alcohol-related liver disease”的研究成果,以人肝脏、人血浆为研究对象,采用deep高深度微量血液蛋白质组-DIA蛋白组学分析了酒精性肝病患者和正常对照的肝和血浆蛋白组,找到了差异蛋白,然后通过机器学习算法确定了三组蛋白生物标志物组合,这些组合具有良好的诊断准确性和预后能力。

 


{xunruicms_img_title}

 

研究思路


 
 
{xunruicms_img_title}

 

研究结果


 
 

 

1.患者、数据收集和研究设计

作者使用非依赖性采集(DIA)模式检测了所有受试者的血浆蛋白以及衍生队列中的79个肝活检蛋白质组,总共量化了5515种蛋白质。


{xunruicms_img_title}

图1 | 蛋白质组学流程

 

2.肝脏病变对肝脏和血浆蛋白质组的影响

肝脏蛋白质组差异分析显示658种蛋白在纤维化阶段显著失调,135种差异蛋白参与了炎症活动,以及68个差异蛋白涉及到脂肪变性。共717种独特蛋白质,占肝脏蛋白质组总定量的13%(图2a)。纤维化对肝脏蛋白质组的影响最大,其次是炎症。失调蛋白中,“肝脏特异性”的蛋白和注释为“分泌”的蛋白的情况(图2c)与之前在NAFLD和肝硬化的研究中报道的情况相似。


{xunruicms_img_title}

图2 |  肝脏病变引起的肝脏蛋白质组重塑

 

血浆蛋白质组分析显示,225个蛋白在纤维化(206个蛋白质)、炎症活性(163个蛋白质)和脂肪变性(48个蛋白质)的组织学阶段过程中丰度发生显著变化(图3a)。其中,随着纤维化程度的增加,134种蛋白质上调,91种蛋白下调(图3b)


{xunruicms_img_title}

图3 | 由于肝脏病变重塑的血浆蛋白质组

 

3.肝脏和血浆蛋白质组学的整合

总共有420种蛋白质在肝脏和血浆中被定量(图4a)。它们表现出双峰模式,“对角线簇”上的蛋白在肝脏和血浆中中相对丰度排名在很大程度上是相关的,而“垂直簇”的蛋白则没有相关性(图4b)。一般来说,细胞内酶是“垂直簇”的一部分;而对“角线簇”则包含有多种不同功能的血浆蛋白(图4c)


{xunruicms_img_title}

图4 | 肝-血浆蛋白质组的整合

 

总的来说,46种蛋白质在肝脏和血浆蛋白质组中共失调(图4g)。这些代表免疫和炎症反应、细胞粘附、ECM组织、蛋白酶抑制剂和细胞内酶(图4g)。它们可能是免疫细胞浸润和全身炎症增加、肝纤维化中的ECM重塑和瘢痕组织形成以及组织渗漏造成的。

 

4.用于酒精性肝病早期病理学的生物标志物组合

作者首先比较了22个最先进的机器学习分类器,并确定了一个逻辑回归模型作为最终的分类器。使用“最小冗余–最大相关性”(mRMR)特征选择算法,作者最后筛选出了由9个生物标志物蛋白组合来识别显著纤维化;6个蛋白组合用于识别轻度炎症活动以及12个蛋白的组合来识别肝脂肪变性。三个生物标志物组合共含有22个蛋白(图6),有7种在血浆和肝脏中均有共调节。基于所选标记物组的Logistic回归模型的交叉验证显示三种组合的平均ROC-AUC分别为0.90(显著纤维化)、0.85(轻度炎症活动)和0.91(脂肪变性)(图5a,d和g)。与使用广泛的15项临床模型相比,所有蛋白质组学模型都具有最高的F1分数和准确性(图5)

 

{xunruicms_img_title}

图5 | 基于血浆蛋白质组的预测模型,用于活检验证的纤维化、炎症和脂肪变性

 

{xunruicms_img_title}

图6 | 所选标记面板中蛋白质的丰度分布

 

5.在独立队列中验证模型性能

蛋白质组学模型在健康匹配的对照队列(n = 136)中正确排除了显著纤维化、晚期纤维化和轻度炎症,准确率分别为99%、100和98%(图7a)。对于有酒精滥用史且由于肝硬度低(n = 97)而未进行活检的患者亚组,蛋白质组学模型分辨显著纤维化和晚期纤维化的准确性分别为93%和100%(图7a)。在独立的ALD验证队列(n = 63)中,F2和I2模型的ROC-AUC分别为0.87和0.81,高于其他分类器(图7 b和c)


{xunruicms_img_title}

图7 | 验证模型性能和评估预后能力

 

6.蛋白质组学模型能准确进行预后测量

对丹麦的457名GALA-ALD队列患者进行随访记录,并定义了两个主要结局:肝脏相关事件(LREs)和全因死亡。将蛋白质组学模型与商业性生物标志物和肝纤维化的组织学分期进行了比较,F2蛋白质组学模型对LRE的预测准确性最高(图7d-f ),AUC 分别为 0.945(3年)和0.933(5年)。对于全因死亡,F2蛋白质组学模型也表现最好,3年和5年AUC分别为0.836和0.818(图7g-i)

 

研究结论

酒精相关性肝病(ALD)是全球肝脏相关死亡的主要原因,但对该疾病的三个关键病理特征 :纤维化、炎症和脂肪变性的了解仍然不完整。研究者使用配对的肝-血浆蛋白质组学方法来推断分子病理生理学。并探索血浆蛋白质组学在596人中的诊断和预后能力。然后使用机器学习模型确定了蛋白质组学生物标志物组合,这些组合在检测显著纤维化和轻度炎症上比现有的临床检测更准确。此外这些生物标志物组合在预测未来肝脏相关事件和全因死亡率方面是准确的。

小鹿推荐

使用DIA蛋白组技术检测了人肝脏和血浆蛋白,并找到了三组蛋白质生物标志物组合,能够在发现队列以及验证队列中准确的诊断和预后。数据非依赖采集(data independent acquisition,DIA)是近年来备受关注的质谱采集技术之一,引领了定量蛋白质组新发展。

相关文章 更多 >