文章

利用WGBS绘制11种实体瘤DNA甲基化单体图谱

2025-08-28     来源:本站     点击次数:65

近日,中国科学院分子细胞科学卓越创新中心石建涛研究员与上海交通大学医学院附属瑞金医院方海研究员合作,通过全基因组亚硫酸盐测序(WGBS)技术绘制了11种常见实体瘤的DNA甲基化单体图谱(DNA methylation haplotype map)。研究团队对110个原发性肿瘤样本的全基因组DNA甲基化数据(WGBS)进行深度分析,共鉴定出81,567个非冗余的DNA甲基化单体水平上的共甲基化区域,称为DNA甲基化单体区块(Methylation Haplotype Blocks, MHBs),这些MHBs在癌症类型中表现出高度特异性,并与基因表达调控、致癌通路密切相关,为癌症检测提供了新的生物标志物。相关研究成果以“Toward the DNA methylation haplotype map of 11 common solid cancers”为题发表于《Cell Reports》期刊。
 

标题:Toward the DNA methylation haplotype map of 11 common solid cancers(11种常见实体癌的DNA甲基化单体图谱)
发表时间:2025.08.23
发表期刊:Cell Reports
影响因子:IF6.9/Q1
技术平台:WGBS
作者单位:中国科学院分子细胞科学卓越创新中心石建涛、上海交通大学医学院附属瑞金医院方海等
DOI:10.1016/j.celrep.2025.116197

在异质性肿瘤中,相邻的CpG位点会形成甲基化单体区块(MHBs),MHBs与基因表达失调有关,但其在泛癌中的动态变化特征和临床意义仍然未知。研究人员对11种常见实体瘤的110个原发性肿瘤样本进行DNA甲基化分析,共鉴定出81,567个MHBs。这些MHBs呈现高度的癌症类型特异性,并富集于基因调控元件。整合的bulk和单细胞转录组分析揭示了MHBs与基因表达的相关性且和平均甲基化水平变化无关。此外,泛癌分析揭示了与MHBs相关的差异表达基因在致癌通路(如G2/M检查点、MYC靶点和E2F信号)中的重要作用。最后研究验证了MHBs可以作为癌症检测的有效生物标志物。本研究将MHBs确立为多模态表观遗传调控因子,可连接肿瘤异质性、转录调控和液体活检等诊断领域。

研究亮点

  • 对110个实体瘤进行DNA甲基化测序,鉴定出81,567个MHBs。
  • MHBs与不依赖于基因表达的甲基化水平变化相关。
  • 与MHBs相关的基因在癌症中失调,并在致癌通路中富集。
  • 肿瘤间异质性分析将甲基化差异与介导突变相关联。


研究摘要

易小结
该研究不仅构建了首个泛癌MHB图谱,还通过多组学整合和单细胞验证,明确了MHBs作为连接表观遗传异质性、转录调控和临床诊断的多功能分子标志物。WGBS技术的全面应用为理解癌症表观遗传学提供了更深的深度和广度。

实验方法
  • 样本收集:研究团队收集了110个原发性肿瘤样本,涵盖11种常见的实体瘤类型,包括头颈部鳞状细胞癌(HNSC)、甲状腺癌(THCA)、非小细胞肺癌(NSCLC)、乳腺癌(BRCA)、食管癌(ESCA)、肝细胞癌(LIHC)、胃腺癌(STAD)、胰腺癌(PACA)、结肠腺癌(COAD)、卵巢浆液性腺癌(OV)和宫颈癌及子宫颈癌(CESC)。
  • WGBS测序分析:对片段化的DNA进行亚硫酸盐转化处理,构建WGBS文库并测序,对WGBS数据进行分析鉴定出MHBs。
  • 外部数据收集与验证:研究团队收集多个公共WGBS和RRBS数据集,用于验证鉴定出的MHBs,并评估其在不同癌症类型中的特异性和共性。
结果图形
(1)11种常见实体瘤中MHBs的鉴定

研究团队对11种常见实体瘤(包括头颈鳞癌HNSC、甲状腺癌THCA、非小细胞肺癌NSCLC、乳腺癌BRCA等)进行了WGBS分析,共鉴定出81,567个非冗余的MHBs(平均长度为107 bp),其中40.65%位于启动子区域。MHBs在癌种间表现出高度特异性,胃肠道肿瘤(如ESCA、STAD、COAD)的MHB频率显著高于其他癌种。


图1:癌症中MHBs的鉴定

  1. 本研究中包含的癌症类型。标注各癌症类型缩写和WGBS样本数量。
  2. 结肠癌中的代表性MHBs。上:单个片段的DNA甲基化状态(黑:甲基化CpG位点;白:未甲基化CpG位点)。中:相邻CpG位点之间的平均LD R2。下:CpG位点间的成对LD R2。
  3. 每种癌症类型中鉴定出的MHBs数量。
  4. 饼图展示MHB在基因组在启动子、外显子、内含子和基因间区域的注释比例。
  5. 内部样本、新鲜冷冻组织和公共肿瘤数据集数据中的MHBs分配到16个非重叠簇中进行聚类分析。
  6. 癌症特异性MHB簇在相应正常组织中的富集分析。

(2)癌症MHBs在开放染色质区域富集
研究团队发现,癌症MHBs在开放染色质区域(通过ATAC-seq定义)中显著富集,超过30%的MHBs与开放染色质区域重叠。通过整合DNA甲基化状态(UMRs、LMRs、PMDs、HMRs),分析结果揭示MHBs主要位于未甲基化区域(UMRs)和部分甲基化区域(PMDs)(占比约60%),且MHBs在低甲基化区域(LMRs)和部分甲基化区域(PMDs)中表现出癌症类型特异性的富集,而在UMRs和HMRs中则没有显著富集。同时,MHB区域在调控平均甲基化水平后,仍显示出更高的染色质开放性。


图2:癌症MHBs在开放染色质区域的富集

  1. 癌症MHBs与匹配癌症类型中的开放染色质区域的重叠分析。
  2. MHBs在DNA甲基化状态区域的注释,包括未甲基化区域(UMRs)、低甲基化区域(LMRs)、部分甲基化区域(PMDs)和高甲基化区域(HMRs)。

(C-D) MHBs在LMRs和PMDs中的富集分析。
(E) 当调控平均甲基化水平的情况下,含有MHBs的基因组区域在开放染色质区域中更富集。
(F) MHBs在疾病状态特异性ChIA-PET数据中的富集分析。

(3)癌症MHBs与基因表达失调相关
研究团队通过整合分析,发现MHBs与基因表达的相关性不依赖于平均甲基化水平的变化,超过50%的MHBs与差异甲基化区域(DMRs)重叠。在食管鳞状细胞癌(ESCC)中,研究团队发现排除DMRs相关基因后,含有MHBs的基因更有可能上调表达。

通过转录调控网络分析(CollecTRI数据库),鉴定出52个在ESCC中活性显著改变的调控因子,包括MYC、HIF1A、E2F家族等,这些因子在G2/M检查点和WNT通路中富集。WGBS的读长水平数据(read-level data)揭示了甲基化单体(mHaps)与基因表达的独立关联,突破了传统平均甲基化分析的局限性。


图3:癌症MHBs与基因表达失调相关

  1. MHBs注释到DMRs。Hyper,高甲基化DMR;Hypo,低甲基化DMR;NC,无显著变化;ND,未确定。

(B-C) MHBs在高甲基化和低甲基化DMRs中的富集分析。
(D) ESCC中MHBs与基因表达失调的关联分析。ESCC数据集(GSE149612)包含10个肿瘤和匹配的10个正常WGBS和RNA-seq样本的,ESCC MHBs(n=27,497),ESCC与邻近正常组织间的DEGs(n=2,769)。

(E) 热图显示含有MHBs的上调基因平均甲基化和表达情况。
(F) 热图显示ESCC和正常食管组织之间的转录因子(TF)活性。
(G) ESCC TE5细胞系的ChIP-seq数据的KLF5结合谱。MHB区域分为ESCC肿瘤特异性(n=20,778)、正常特异性(n=10,501)或共有(n=7,368)。

(4)利用单细胞数据验证结肠癌MHBs
研究团队利用单细胞甲基化测序(scBS-seq)数据,验证了结肠癌MHBs的调控作用。在单细胞水平上,MHBs在不同类型的恶性细胞中表现出显著的一致性,表明这些MHBs在结肠癌中具有优异的调控作用。此外,研究团队发现含有MHBs的基因在单细胞中表现出更高的表达水平,进一步证实了MHBs在基因表达调控中的作用。


图4:利用单细胞数据验证癌症MHBs及其调控作用

(A)单细胞DNA甲基化单体(sc-mHap)示意图。上:CpG平均甲基化二元分类(甲基化>0.9;未甲基化<0.1)生成sc-mHaps。下:15个单细胞的示例mHap模式。
(B)CRC单细胞数据中鉴定出的COAD MHB示例。

(C)不同单细胞样本类型中鉴定出的MHB重叠情况。
(D)以泛癌MHB为背景,对原发性肿瘤单细胞MHB与11种癌症类型的bulk样本MHB进行富集分析。
(E)基因表达与启动子区域MHBs的相关性。每个单细胞根据平均甲基化水平将启动子分为三组:高甲基化(>0.8)、中等甲基化(0.2–0.8)和低甲基化(<0.2)。组内比较了含有或不含有MHBs的启动子对应的基因表达。
(F)中等、低甲基化启动子组中MHB甲基化水平对基因表达的作用。
(G)单细胞CRC中MHBs与基因表达失调的关联。
(H)Venn图显示PT和LN肿瘤中上调且启动子区域含MHB但无DMRs的基因数量。PT:原发性肿瘤,n=581、LN:淋巴结转移,n=346。
(I)PT和LN中共有的42个与MHB相关基因的通路富集分析。
(J)热图显示含有MHB的42个共有基因在单细胞中的平均甲基化和表达水平。在MYC靶点和G2/M检查点通路中注释的基因用红色标记。
(K)使用TCGA-COAD数据集验证(J)中在不同病理阶段突出显示的10个基因的DNA甲基化和基因表达谱。
(L)TCGA-COAD数据集中,按CBX3基因高/低表达对患者亚组进行分层,比较无病生存(DFS)的Kaplan-Meier生存曲线。

(5)泛癌MHBs与差异表达基因相关
研究人员通过整合TCGA多组学数据发现,MHBs与11种癌症中DEGs显著相关,无论有或没有DMRs基因。通过优先级指数(Priority Index, Pi)分析,研究团队筛选出8,852个泛癌MHB靶基因,其中53个基因构成通路交叉网络,包括MYC靶点、G2/M检查点和E2F通路等关键致癌通路。


图5:癌症MHBs与泛癌中差异表达基因相关

  1. 癌症MHB相关基因在差异表达基因中的富集分析。森林图显示癌症MHB相关基因(排除DMR相关基因)在DEGs中的富集。
  2. 泛癌MHB相关基因的通路富集分析。筛选出六种以上癌症类型共有的MHB相关基因。上:共有上调基因的基因集富集。下:在G2/M检查点或MYC活性通路中被注释选定基因在不同癌症类型中的甲基化和表达谱差异。
  3. 泛癌通路交叉分析。
  4. 在TCGA数据集的CESC、LIHC、LUAD和PAAD中,根据RRM2和SLC2A1基因高/低表达对患者亚组进行分层,比较总生存率的Kaplan-Meier生存曲线。
(6)癌症DNA甲基化肿瘤间异质性表征
研究团队分析了MHBs在不同肿瘤中的甲基化一致性,发现肿瘤间存在显著的甲基化异质性。MHBs内的CpG位点表现出高甲基化相关性,显著高于随机基因组区域。通过比较具有极端一致性(AUC)的肿瘤,结果揭示了IDH1突变型胶质瘤的AUC值显著高于野生型,表明突变驱动了甲基化异质性。
 


图6:癌症中DNA甲基化肿瘤间异质性表征

  1. 箱线图显示TCGA 450K甲基化芯片数据中成对CpG位点平均甲基化的皮尔逊相关系数。分析区域包括:泛癌MHBs(所有癌症类型联合MHBs)、癌症类型特异性MHBs、CpG岛(CGI)和随机基因组区域。
  2. 一致性甲基化水平的定量分析。以COAD为例,使用LOESS曲线拟合MHBs与随机区域之间的平均甲基化和方差。AUC量化一致性(AUC值越低,一致性越高)。
  3. 低AUC和高AUC肿瘤之间的DEGs数量。红色表示上调;蓝色表示下调。
  4. 上调DEGs中富集的通路(来自MSigDB的标志性通路)。
  5. AUC分析驱动突变与一致性甲基化水平之间的相关性火山图。红色:AUC升高;蓝色:AUC降低。
  6. 箱线图显示IDH1突变与TCGA数据集中甲基化一致性显著相关。
  7. IDH1突变效应的独立验证(GSE50774)。
(7)基于血浆cfDNA的癌症MHBs作为非侵入性癌症检测的生物标志物
研究团队利用MHBs作为生物标志物,开发了基于血浆cfDNA的非侵入性癌症检测方法。通过计算甲基化单体负荷(Methylation Haplotype Load, MHL)和甲基化区块评分(Methylation Block Score, MBS),研究团队在多种胃肠道癌症中实现了高灵敏度和特异性的癌症检测,性能优于现有的基于CpG位点平均甲基化的检测方法。在6种胃肠道癌症中,MHL模型的AUC达0.79-0.97,特异性为98%,灵敏度为56.07%-91%。
 


图7:基于癌症MHB的血浆DNA非侵入性癌症检测

  1. 作为癌症检测生物标志物的MHB区域。从癌症MHB中鉴定出的通用癌症标志物,展示肿瘤和正常样本中16种k-mers频率分布。
  2. 随机森林模型对基于血浆DNA中MHL、MBS和CpG位点的平均甲基化水平进行的癌症性能检测。通过5折交叉验证比较结直肠癌(CRC)、食管鳞癌(ESCC)、肝细胞癌(HCC)、胃癌(GC)、食管腺癌(EAC)和胰腺导管腺癌(PDAC)与正常样本的受试者工作特征(ROC)曲线及曲线下面积(AUC)值。

结论和启示
本研究通过WGBS技术,揭示了11种常见实体瘤中MHBs的特征和功能。研究结果表明,MHBs作为细胞身份的特征,不仅具有组织特异性,还具备疾病状态特异性。MHBs在开放染色质区域中富集,表明其在基因表达调控中发挥重要作用。MHBs与基因表达显著相关且不依赖于平均甲基化水平变化,这一发现通过单细胞数据得到进一步验证。在临床应用方面,MHBs作为生物标志物在非侵入性癌症检测中表现出优越的性能,为早期癌症检测提供了新的工具。

WGBS技术在本研究中发挥了关键作用,使得研究团队能够以单碱基分辨率分析DNA甲基化模式,鉴定出与癌症发生和发展密切相关的MHBs。未来的研究可以利用WGBS技术进一步探索其他癌症类型中的DNA甲基化图谱,开发更多基于表观遗传学的癌症诊断和治疗策略。

参考文献:
Zhang Z, Hong Y, Zhang S, Zhu X, Liu L, Liao X, Gu H, Fang H, Shi J. Toward the DNA methylation haplotype map of 11 common solid cancers. Cell Rep. 2025 Aug 23;44(9):116197. doi: 10.1016/j.celrep.2025.116197.

相关文章 更多 >