文章

三代ONT测序技术检测组织DNA甲基化R10和R9芯片测序性能数据比较

2025-08-08     来源:本站     点击次数:33

近日,美国波士顿东北大学Miten Jain团队评估了牛津纳米孔测序(Oxford Nanopore Technologies, ONT)技术在检测人类原代组织DNA甲基化中的性能,特别比较了 ONT R9和升级版R10测序芯片在检测人体外细胞系、脑组织和血液样本的5-甲基胞嘧啶(5-methylcytosine, 5mC)数据差异,并与其他测序技术(PacBio长读长测序和Illumina亚硫酸盐测序)进行多层次比较分析。研究结果表明,ONT R10芯片检测DNA甲基化具有更高的准确性和分辨率,尤其是在同聚物区域(homopolymer regions)。
 

doi: 10.1101/gr.279159.124
 
近年来,ONT和PacBio单分子测序技术促进了长读长天然DNA分子(包括胞嘧啶甲基化)测序的发展。特别是ONT最近将其纳米孔测序芯片从R9版本升级到R10版本,极大提高了测序的准确性和通量水平。但这种升级对甲基化检测的作用尚未被报道。本研究比较了ONT纳米孔测序R9和R10芯片对三种人类基因组数据集(体外细胞系样本、大脑前额叶皮层样本和血液样本)的5mC检测结果差异。研究者对CpG岛和同聚物区域进行深入分析,并比较不同测序技术之间甲基化检测数据的一致性,分析结果表明在体外细胞系数据集中,ONTR10芯片与Illumina亚硫酸盐测序技术之间的相关性最强。
 
易小结
本研究通过对比ONT纳米孔测序技术的R9和R10芯片,揭示了ONT R10芯片在检测人类原代组织DNA甲基化中的显著优势,特别是在提高测序准确性和检测极值甲基化水平(0%和100%)方面表现优异,为表观遗传学研究提供了更精准工具。

ONT长读长测序能够直接检测DNA序列及其修饰,无需额外样本处理,极大简化了表观遗传学研究流程。研究不仅验证了ONT R10在甲基化检测中的高效性和准确性,还为未来大规模基因组测序项目(如队列研究)提供了重要的技术参考。

易基因作为专注于表观基因组技术的公司,其相关业务产品如ONT R10长读长测序、全基因组亚硫酸盐测序(WGBS)等,可为客户提供更全面、更精准的表观遗传学解决方案,助力在基因调控、疾病机制和药物开发等研究领域取得突破性进展。
 
研究方法
样本收集与测序:人血液、大脑和体外细胞系样本。
数据处理与分析:R9样本使用Guppy v6.1.2进行碱基识别,R10样本使用Guppy v6.3.8进行碱基识别。使用minimap2将reads比对至GRCh38人类参考基因组,并使用Modkit工具从比对后的BAM文件中提取甲基化信息。此外还使用DeepVariant和Sniffles2进行变异检测。
甲基化检测与比较:通过比较R9和R10测序数据在CpG岛、同聚物区域以及全基因组范围内的甲基化水平,评估两种芯片的性能差异。同时将ONT测序数据与PacBio长读长测序和Illumina亚硫酸盐测序数据进行对比分析,以验证甲基化检测的准确性和一致性。
 
结果图形
(1)ONT测序技术改进
研究首先分别使用R9和R10芯片的ONT技术对HG002细胞系进行测序质量比较。分析结果表明,R10数据在准确性和读长方面均显著提升。R10数据的比对一致性中位数较高,达到98.72%,而R9数据为95.05%。此外R10数据在变异检测中也表现出更高准确性。这些改进研究结果表明,R10芯片在提高测序准确性和检测能力中具有显著优势。
 
(2)R9与R10 ONT数据的甲基化检测比较
研究利用HG002细胞系R9和R10数据中的甲基化信息与全基因组重亚硫酸盐测序(WGBS)数据进行比较分析。分析结果揭示R10数据在甲基化检测方面与WGBS数据具有更高的相关性(Pearson r = 0.969),高于R9数据的相关性。此外,R10数据在低甲基化(0%–10%)和高甲基化(90%–100%)区域的检测比例上与R9数据存在显著上升,表明R10在甲基化极值检测上更为准确。

 
图1:在HG002细胞系、血液和大脑样本中对R9和R10数据集的DNA甲基化检测结果进行总体比较。

(A)HG002细胞系的R9(橙色)和R10(蓝色)数据的甲基化水平,数据按照亚硫酸盐(绿色)甲基化区间分箱。R9和R10甲基化分布中与亚硫酸盐甲基化范围一致的部分以绿色突出显示。
(B–D)小提琴图显示HG002细胞系(B)、大脑样本(C)和血液样本(D)的R9和R10数据的甲基化水平,数据按照R9区间分箱。每个小提琴图都用线连接中位数区间点以可视化甲基化趋势。右侧展示CpG位点甲基化频率分布。
(E)堆叠条形图展示每种技术、每个样本的总CpG位点的分布情况。
 
(3)R9与R10甲基化差异特征分析
研究进一步分析了R9和R10数据在同聚物区域的甲基化检测差异。分析结果显示,R10数据在同聚物区域的甲基化检测上具有更高的分辨率,能够更准确鉴定出甲基化状态。此外R10数据在基因启动子区域和CpG岛的甲基化检测上也表现出更高准确性,表明R10芯片检测复杂基因组区域甲基化具有显著优势。

 

图2:HG002 R9和R10数据集的全基因组及区域甲基化检测。

 
(A)HG002 R9和R10中所有CpG位点(合并链)的甲基化检测结果。
(B)R9和R10的2kb全基因组窗口范围的散点图,每个窗口至少包含10个CpG位点。
(C、D)29124个人类启动子区域(每个区域至少有10个CpG位点)平均甲基化水平直方图和散点图。
(E、F)HG002中包含至少10个CpG位点的CpG岛BED区域的直方图和散点图。
 
图3:不同测序技术对HG002永生化细胞系的甲基化检测结果比较分析。
 
(A)每种技术的甲基化水平直方图。
(B)不同技术之间的特定位点CpG甲基化水平成对比较分析。
(C)R10与亚硫酸盐测序之间的特定位点CpG甲基化水平比较分析。
(D)在BisMap定义的Illumina 150 bp成对比对区域中,不同技术之间的成对比较RMSE值。
(E)在Illumina 150 bp不能成对比对区域中,不同技术之间的成对比较RMSE值。
 
(4)人类原代血液和大脑组织样本的甲基化比较
研究还评估了R9和R10芯片在人类原代血液和大脑组织样本中的甲基化检测性能。分析结果表明,R10数据对大脑和血液样本的甲基化检测均表现出更高的准确性和覆盖深度。R10数据在检测甲基化极值(0%和100%)中灵敏度更高,有助于提高鉴定出甲基化水平变化的灵敏度。

 

图4:细胞、血液和大脑样本之间的单倍型特异性甲基化差异与共性。从上到下每图显示基因组坐标、标记的基因模型(若有)、带有修饰碱基的单倍型感知reads比对(黑色表示甲基化,彩色表示未甲基化),平滑的甲基化水平图和覆盖深度图。底部坐标表示平滑甲基化图中使用的甲基化分箱。

 
(A)HG002细胞系R9和R10测序的单倍型特异性甲基化差异与共性。
(B)细胞系、血液和大脑样本R10测序的单倍型特异性甲基化差异与共性。
 
讨论和启示
本研究系统评估了牛津纳米孔测序技术在检测人类原代组织DNA甲基化中的性能,特别比较了R9和R10两种芯片的差异。研究结果表明,R10芯片在提高测序准确性和甲基化检测能力方面具有显著优势。此外研究还发现,不同测序技术(如ONT、PacBio和Illumina)在甲基化检测上存在一定差异,在不同平台上的产生的数据差异,值得深入探究。未来研究应进一步探索不同测序技术在甲基化检测中的应用,并优化数据分析策略,以提高甲基化检测的准确性和可靠性。

参考文献:
Genner R, Akeson S, Meredith M, Jerez PA, Malik L, Baker B, Miano-Burkhardt A, CARD-long-read Team, Paten B, Billingsley KJ, Blauwendraat C, Jain M. Assessing DNA methylation detection for primary human tissue using nanopore sequencing. Genome Res. 2025 Mar 7. doi: 10.1101/gr.279159.124.
相关文章 更多 >