大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。
近日,美国哈佛医学院Mahdi Moqri和Vadim N. Gladyshev教授团队合作在《Nature Communications》期刊发表题为“Integrative epigenetics and transcriptomics identify aging genes in human blood”的科研成果。研究团队通过大规模的DNA甲基化(DNAm)与转录组学(RNA-seq)队列数据,开发了一种高分辨率多组学综合分析方法,对表观基因组学和转录组学衰老相关变化进行综合分析,从人类血液样本中鉴定出106个“多组学衰老基因”(multi-omic aging genes)。
研究团队利用MESA、PPMI、Generation Scotland等队列的4,174个DNAm样本和3,461个RNA-seq样本,并利用935k甲基化芯片的MGB500队列(n=461)作为金标准构建参考验证集,鉴定出在衰老过程中同时发生DNA甲基化增加和基因表达下降的106个多组学衰老基因,这些基因显著富集于T细胞适应性免疫功能相关通路。与单一组学鉴定衰老标志物相比,这些多组学衰老基因在不同类型人群验证中表现出更高的可重复性,并与全因死亡率等衰老结局强关联,为靶向免疫衰老的精准干预提供了可靠的分子靶点。

英文标题:Integrative epigenetics and transcriptomics identify aging genes in human blood
中文标题:表观基因组学和转录组学综合分析鉴定出人类血液中的衰老基因
发表时间:2026-01-19
发表期刊:Nature Communications
影响因子:IF15.7/Q1
技术平台:935k甲基化芯片、RNA-seq
作者单位:美国哈佛医学院
DOI:10.1038/S41467-025-67369-1
易小结
本研究阐明了多组学整合策略显著优于单一组学在衰老研究中的关键证据,证明了“多组学整合”在鉴定功能相关、可重复性强的衰老生物标志物方面的优越性。为未来衰老生物学研究,尤其是开发更可靠、更具生物学解释性的“表观衰老时钟”指明了方向。
研究通过利用DNA甲基化和转录组测序数据明确了血液衰老过程中DNA甲基化增加伴随基因表达下降之间的特定联系,为理解免疫衰老是机体衰老的关键驱动因子提供了坚实的多组学方法参考。
研究方法
(1)研究队列与数据集
- DNAm数据集:纳入6个大规模队列,包括MESA(两个时间点:MESA1 n=886,MESA2 n=888)、PPMI(n=510)、RA(类风湿关节炎队列,n=689)、Grady(创伤项目,n=795)、GENOA(n=946)和本研究的MGB500队列(n=461,935k芯片,年龄20-90岁)。此外使用MGB4K(n=4,243)和Generation Scotland(GS)(n=18,859)的DNAm数据和全因死亡率数据进行生存分析验证。
- RNA-seq数据集:纳入6个队列,包括MESA1(n=1,016)、MESA2(n=845)、PPMI(n=1,111)、GC6(Gates Grand Challenge,n=327)、500FG(n=97)和JenAge(n=62)。
表1:本研究使用的数据集
(2)多组学衰老基因鉴定四步流程
- 鉴定衰老转录本(Aging Transcripts, ATs):基于Peters等人(2015)定义的1,497个衰老相关转录本,鉴定与衰老显著相关的ATs。
- 定义衰老调控区域(Aging Regulatory Regions, ARGs):根据每个AT,定义其转录起始位点(TSS)±1,500 bp区域(基于Gencode Hg38注释)。
- 鉴定衰老CpG位点(Aging CpGs, ACs):在ARG区域内,筛选≥3个连续CpG位点且DNAm水平与衰老显著相关的区域。
- 筛选候选衰老基因(Candidate AGs):筛选那些DNAm变化方向与其关联ATs的基因表达变化方向差异ACs(如衰老过程中DNAm增加伴随表达下调),定义为候选衰老基因,最终获得106个经验证的多组学衰老基因。
(3)统计分析
- 关联分析:评估DNAm/表达与衰老相关性,并进行可重复性验证和多重检验校正。
- 生存分析:检验每个与多组学衰老基因相关的CpG位点和全因死亡率的关联。
- 细胞组分校正分析:评估血液细胞组分比例。在分析衰老与DNAm的关联时,将细胞比例作为协变量纳入线性回归模型,以评估年龄效应是否独立于细胞组分变化。
- 功能富集分析:功能富集分析,并进行疾病-基因关联分析。
结果图形
(1)与DNAm相比,衰老相关基因表达的可重复性差
研究团队首先在六个独立的RNA-seq数据集(MESA1、MESA2、PPMI、GC6、500FG、JenAge)中鉴定与衰老相关的基因,结果发现衰老相关基因表达在不同队列间表现出显著的异质性(图1b)。例如,基因CD248表达与衰老呈负相关,但其相关性系数在不同队列间波动较大(MESA1:r=-0.34;500FG:r=-0.54;JenAge:r=-0.56)(图1c),且Peters等人(2015)鉴定的1,497个衰老转录本,不同队列间的相关性普遍较低且存在差异(图1d)。这表明衰老相关的转录组数据在不同队列间的可重复性较差。
相比之下,对六个DNAm数据集(MESA1、MESA2、PPMI、RA、Grady、GENOA)分析显示,TOP10的衰老相关CpG位点(如ELOVL2启动子区的cg16867657)在所有队列中均表现出高度一致衰老相关性(Pearson相关系数:MESA1 r=0.74,RA r=0.84,GENOA r=0.84)(图1g-h)。这种不同队列数据高度一致性表明,DNAm变化是血液中更为优越稳定和可重复的衰老标志物,但需要与功能性的转录组数据整合以揭示其生物学意义。
图1:血液中的衰老相关转录本与衰老相关CpG位点
- 本分析所使用的6个RNA-seq数据集中按队列和性别划分的年龄分布。
- 不同队列的前10个最显著衰老相关转录本。
- 不同队列中CD248基因表达水平与衰老的关系。
- 不同队列中衰老转录本(Peters等,2015)与年龄及基因表达的相关性。
- 本分析所使用的6个DNAm数据集中按队列和性别划分的年龄分布。
- 不同队列的前10个最显著衰老相关DNAm位点。
- 不同队列中衰老CpG位点(Varshavsky等,2023)甲基化水平与衰老的相关性。
- 不同队列中ELOVL2启动子区(cg16867657)甲基化水平与衰老的关系。
(2)多组学综合分析鉴定出经验证的衰老相关基因
为克服单一组学局限,研究者综合分析同时具备DNAm和RNA-seq数据的MESA(两个时间点)和PPMI队列。结果发现,在DNAm水平与衰老相关性最强区域(甲基化增加最显著100个CpG位点),其对应基因的表达水平与衰老相关性非常低(图2a)。而与之相反的是,在衰老过程中表达水平最显著下降的100个基因中,其启动子区DNAm水平与衰老呈显著正相关(图2b)。
具体而言,ELOVL2、KLF14和FHL2等衰老显著相关CpG位点的基因,在年轻(≤45岁)与年老(≥75岁)个体间的表达水平无显著差异(图2c左);而CD248、LRRN3和NELL2等最显著下调转录本则在老年个体中表现出显著启动子区高甲基化(图2c右)。特别值得注意的是,CD248在MESA两个时间点及PPMI中均表现出DNAm与衰老的强正相关和表达与衰老的强负相关(图2d)。这一模式在MESA两个时间点和PPMI数据集中均成立。
研究进一步显示,加入DNAm数据后,可验证的衰老相关基因比例显著增加(图2e)。这证明了多组学综合分析对于鉴定可靠、功能关联的衰老基因的有效性。

图2:多组学生物标志物分析鉴定功能性衰老基因
(3)用于血液衰老研究的金标准参考DNA甲基化数据集
为对鉴定的多组学衰老基因进行独立验证,研究利用935k甲基化芯片对Mass General Brigham队列的500名个体(MGB500,质控后n=461)进行DNAm检测。该队列年龄跨度20-90岁,性别和种族分布均衡,可作为血液衰老生物标志物的金标准参考数据集(图3a)。
分析结果显示,该队列中衰老相关CpGs位点的DNAm水平表现出与衰老一致变化,且相关性略强于其他队列(图3b),Pearson系数与Spearman相关性高度一致,表明结果不受离群值影响。值得注意的是,与衰老强相关的CpG位点(特别是甲基化增加位点)显著富集于低表达和转录抑制基因,这些基因强富集于PRC2(Polycomb Repressive Complex 2)结合区域(图3d-e),与先前关于PRC2在表观遗传衰老中作用的报道一致。研究还在该数据集中确认,表达与衰老呈负相关的基因,其启动子区的CpG位点存在甲基化增加(图3f)。
最后,通过整合DNAm和转录组数据的四步流程,研究在MGB等多个队列中验证了106个同时具有年龄依赖性DNAm增加和表达水平下降的基因,并将其定义为“多组学衰老基因”。这些基因在不同队列验证的比例(结合DNAm数据后)远高于仅基于转录组数据鉴定的基因(图3g)。有趣的是,这些多组学衰老基因显著富集于T细胞特异性基因(如CD27、CD28、CD248、TCF7),KEGG通路富集分析也证实其在T细胞受体信号和分化通路中显著富集。
图3:加入表观遗传(DNA甲基化)衰老参考数据集提高转录组衰老验证的准确性
(4)多组学衰老基因预测衰老结局
为评估所鉴定多组学衰老基因的功能相关性,研究分析了其与衰老相关结局(特别是死亡率)的关联。利用包含DNA甲基化和死亡率数据的大型数据集(MGB-4K和Generation Scotland队列),发现与多组学衰老基因相关的CpG位点,在两个队列中都与全因死亡风险强相关(图4a)。通过多变量Cox比例风险回归模型(校正年龄和性别),发现这些基因的CpG位点与死亡风险显著相关(图4b)。
生存分析显示,基于死亡风险强相关CpG位点(例如TCF7基因内的cg06175418)的甲基化水平,可以清晰对受试者进行风险分层(图4c)。此外,对这些多组学衰老基因的疾病基因网络过表征分析揭示,它们富集于众多衰老相关疾病,特别是与衰老免疫系统相关疾病(如各种淋巴瘤)(图5f)。
上述分析结果显示,与单一组学鉴定的衰老基因相比,多组学衰老基因与衰老相关结局(如死亡率)更强相关,表明整合DNAm与转录组数据不仅能提高标志物的生物学可解释性,还能增强其临床预测价值。
图4:多组学衰老基因与死亡率的相关性分析
(5)衰老基因中与衰老相关的甲基化独立于细胞组分变化
血液是异质性组织,其细胞组分比例随年龄变化。鉴于多组学衰老基因显著富集于T细胞分化基因(图5a-b),研究需要揭示这些基因的衰老模式是否基于年龄相关细胞组分变化。为此,研究使用甲基化数据评估了MGB队列样本的细胞组分比例(图5c)。结果显示,最常见细胞类型比例随年龄变化不大,但初始T细胞(naive T cells)比例随年龄急剧减少,与人类免疫衰老的已知表征一致(图5d)。
在校正细胞组分后,多组学衰老基因内的CpG位点甲基化水平仍与衰老强相关(图5e)。这一结果表明,这些CpG位点的年龄相关甲基化变化独立于细胞组分变化,是细胞内在衰老过程的更直接反映,增强了其作为稳健衰老生物标志物的可靠性。
图5:衰老基因、细胞分化与细胞组分。
结论和启示
本研究通过大规模综合分析DNA甲基化和转录组学数据,鉴定出106个在人类血液衰老过程中DNA甲基化增加与基因表达下调协同发生的“多组学衰老基因”。这些基因在不同人群队列验证中表现出卓越的稳定性,与全因死亡率等衰老结局强相关,且其衰老相关的甲基化变化独立于血液细胞组分变化。
意义启示
- 基础研究:揭示衰老过程中表观遗传沉默(PRC2靶向区域的甲基化增加)与关键免疫功能基因下调之间的具体联系,深化对衰老分子机制的理解。
- 生物标志物开发:基于多组学衰老基因的CpG位点可构建更可靠的衰老时钟或死亡风险预测模型。
- 干预策略:鉴定出的T细胞相关“多组学衰老基因”为开发靶向免疫衰老的干预措施(如表观遗传编辑、小分子药物)提供精确分子靶点。
- 研究拓展:未来可拓展至其他衰老相关组织(如脑、肌肉、脂肪、皮肤);此外,纵向队列研究将有助于明确变化是衰老的原因或结果,及进行可逆性干预。
参考文献:Moqri M, Ying K, Poganik JR, Herzog C, Chen Q, Emamifar M, Tyshkovskiy A, Eames A, Mur J, Glubokov D, Matei-Dediu B, Goeminne L, Mitchell W, McCartney DL, Salas LA, Marioni RE, Lasky-Su JA, Snyder MP, Gladyshev VN. Integrative epigenetics and transcriptomics identify aging genes in human blood. Nat Commun. 2026 Jan 19.doi: 10.1038/s41467-025-67369-1.