近日,中国科学院分子细胞科学卓越创新中心石建涛研究员与上海交通大学医学院附属瑞金医院方海研究员合作,通过全基因组亚硫酸盐测序(WGBS)技术绘制了11种常见实体瘤的DNA甲基化单体图谱(DNA methylation haplotype map)。研究团队对110个原发性肿瘤样本的全基因组DNA甲基化数据(WGBS)进行深度分析,共鉴定出81,567个非冗余的DNA甲基化单体水平上的共甲基化区域,称为DNA甲基化单体区块(Methylation Haplotype Blocks, MHBs),这些MHBs在癌症类型中表现出高度特异性,并与基因表达调控、致癌通路密切相关,为癌症检测提供了新的生物标志物。相关研究成果以“Toward the DNA methylation haplotype map of 11 common solid cancers”为题发表于《Cell Reports》期刊。
标题:Toward the DNA methylation haplotype map of 11 common solid cancers(11种常见实体癌的DNA甲基化单体图谱)
发表时间:2025.08.23
发表期刊:Cell Reports
影响因子:IF6.9/Q1
技术平台:WGBS
作者单位:中国科学院分子细胞科学卓越创新中心石建涛、上海交通大学医学院附属瑞金医院方海等
DOI:10.1016/j.celrep.2025.116197
在异质性肿瘤中,相邻的CpG位点会形成甲基化单体区块(MHBs),MHBs与基因表达失调有关,但其在泛癌中的动态变化特征和临床意义仍然未知。研究人员对11种常见实体瘤的110个原发性肿瘤样本进行DNA甲基化分析,共鉴定出81,567个MHBs。这些MHBs呈现高度的癌症类型特异性,并富集于基因调控元件。整合的bulk和单细胞转录组分析揭示了MHBs与基因表达的相关性且和平均甲基化水平变化无关。此外,泛癌分析揭示了与MHBs相关的差异表达基因在致癌通路(如G2/M检查点、MYC靶点和E2F信号)中的重要作用。最后研究验证了MHBs可以作为癌症检测的有效生物标志物。本研究将MHBs确立为多模态表观遗传调控因子,可连接肿瘤异质性、转录调控和液体活检等诊断领域。
研究亮点
研究摘要
图1:癌症中MHBs的鉴定
图2:癌症MHBs在开放染色质区域的富集
(C-D) MHBs在LMRs和PMDs中的富集分析。
(E) 当调控平均甲基化水平的情况下,含有MHBs的基因组区域在开放染色质区域中更富集。
(F) MHBs在疾病状态特异性ChIA-PET数据中的富集分析。
(3)癌症MHBs与基因表达失调相关
研究团队通过整合分析,发现MHBs与基因表达的相关性不依赖于平均甲基化水平的变化,超过50%的MHBs与差异甲基化区域(DMRs)重叠。在食管鳞状细胞癌(ESCC)中,研究团队发现排除DMRs相关基因后,含有MHBs的基因更有可能上调表达。
通过转录调控网络分析(CollecTRI数据库),鉴定出52个在ESCC中活性显著改变的调控因子,包括MYC、HIF1A、E2F家族等,这些因子在G2/M检查点和WNT通路中富集。WGBS的读长水平数据(read-level data)揭示了甲基化单体(mHaps)与基因表达的独立关联,突破了传统平均甲基化分析的局限性。
图3:癌症MHBs与基因表达失调相关
(B-C) MHBs在高甲基化和低甲基化DMRs中的富集分析。
(D) ESCC中MHBs与基因表达失调的关联分析。ESCC数据集(GSE149612)包含10个肿瘤和匹配的10个正常WGBS和RNA-seq样本的,ESCC MHBs(n=27,497),ESCC与邻近正常组织间的DEGs(n=2,769)。
(E) 热图显示含有MHBs的上调基因平均甲基化和表达情况。
(F) 热图显示ESCC和正常食管组织之间的转录因子(TF)活性。
(G) ESCC TE5细胞系的ChIP-seq数据的KLF5结合谱。MHB区域分为ESCC肿瘤特异性(n=20,778)、正常特异性(n=10,501)或共有(n=7,368)。
(4)利用单细胞数据验证结肠癌MHBs
研究团队利用单细胞甲基化测序(scBS-seq)数据,验证了结肠癌MHBs的调控作用。在单细胞水平上,MHBs在不同类型的恶性细胞中表现出显著的一致性,表明这些MHBs在结肠癌中具有优异的调控作用。此外,研究团队发现含有MHBs的基因在单细胞中表现出更高的表达水平,进一步证实了MHBs在基因表达调控中的作用。
图4:利用单细胞数据验证癌症MHBs及其调控作用
(A)单细胞DNA甲基化单体(sc-mHap)示意图。上:CpG平均甲基化二元分类(甲基化>0.9;未甲基化<0.1)生成sc-mHaps。下:15个单细胞的示例mHap模式。
(B)CRC单细胞数据中鉴定出的COAD MHB示例。
(C)不同单细胞样本类型中鉴定出的MHB重叠情况。
(D)以泛癌MHB为背景,对原发性肿瘤单细胞MHB与11种癌症类型的bulk样本MHB进行富集分析。
(E)基因表达与启动子区域MHBs的相关性。每个单细胞根据平均甲基化水平将启动子分为三组:高甲基化(>0.8)、中等甲基化(0.2–0.8)和低甲基化(<0.2)。组内比较了含有或不含有MHBs的启动子对应的基因表达。
(F)中等、低甲基化启动子组中MHB甲基化水平对基因表达的作用。
(G)单细胞CRC中MHBs与基因表达失调的关联。
(H)Venn图显示PT和LN肿瘤中上调且启动子区域含MHB但无DMRs的基因数量。PT:原发性肿瘤,n=581、LN:淋巴结转移,n=346。
(I)PT和LN中共有的42个与MHB相关基因的通路富集分析。
(J)热图显示含有MHB的42个共有基因在单细胞中的平均甲基化和表达水平。在MYC靶点和G2/M检查点通路中注释的基因用红色标记。
(K)使用TCGA-COAD数据集验证(J)中在不同病理阶段突出显示的10个基因的DNA甲基化和基因表达谱。
(L)TCGA-COAD数据集中,按CBX3基因高/低表达对患者亚组进行分层,比较无病生存(DFS)的Kaplan-Meier生存曲线。
(5)泛癌MHBs与差异表达基因相关
研究人员通过整合TCGA多组学数据发现,MHBs与11种癌症中DEGs显著相关,无论有或没有DMRs基因。通过优先级指数(Priority Index, Pi)分析,研究团队筛选出8,852个泛癌MHB靶基因,其中53个基因构成通路交叉网络,包括MYC靶点、G2/M检查点和E2F通路等关键致癌通路。
图5:癌症MHBs与泛癌中差异表达基因相关
图6:癌症中DNA甲基化肿瘤间异质性表征
图7:基于癌症MHB的血浆DNA非侵入性癌症检测
结论和启示
本研究通过WGBS技术,揭示了11种常见实体瘤中MHBs的特征和功能。研究结果表明,MHBs作为细胞身份的特征,不仅具有组织特异性,还具备疾病状态特异性。MHBs在开放染色质区域中富集,表明其在基因表达调控中发挥重要作用。MHBs与基因表达显著相关且不依赖于平均甲基化水平变化,这一发现通过单细胞数据得到进一步验证。在临床应用方面,MHBs作为生物标志物在非侵入性癌症检测中表现出优越的性能,为早期癌症检测提供了新的工具。
WGBS技术在本研究中发挥了关键作用,使得研究团队能够以单碱基分辨率分析DNA甲基化模式,鉴定出与癌症发生和发展密切相关的MHBs。未来的研究可以利用WGBS技术进一步探索其他癌症类型中的DNA甲基化图谱,开发更多基于表观遗传学的癌症诊断和治疗策略。
参考文献:
Zhang Z, Hong Y, Zhang S, Zhu X, Liu L, Liao X, Gu H, Fang H, Shi J. Toward the DNA methylation haplotype map of 11 common solid cancers. Cell Rep. 2025 Aug 23;44(9):116197. doi: 10.1016/j.celrep.2025.116197.