文章

纳米孔测序仪在线粒体DNA控制区异质性检测分析全流程中的应用

2023-09-18     来源:本站     点击次数:872

近日,四川大学华西基础医学与法医学学院的侯一平教授团队基于国产QNome纳米孔测序平台,在法医遗传学的TOP期刊Forensic Science International: Genetics上在线发表题为《CmVCall: an automated and adjustable nanopore analysis pipeline for heteroplasmy detection of the control region in human mitochondrial genome》的研究成果。
 
研究团队基于齐碳科技纳米孔QNome测序平台自主开发了mtDNA控制区异质性检测分析全流程—CmVCall,研究结果表明齐碳QNome平台对线粒体控制区序列识别具有简便性和适用性。
 
此研究为纳米孔基因测序技术常规应用于线粒体基因组奠定了坚实的基础,也进一步拓展了齐碳科技纳米孔测序平台的应用场景。
 
背景
线粒体DNA(mitochondrial DNA,mtDNA)是真核生物中独立于核基因组之外的遗传物质,呈闭环双链结构,具有母系遗传、多拷贝、异质性阈值效应及变异率较高等特点。由于mtDNA 特殊的遗传特征和环状分子结构,mtDNA检测分析在法医学、群体遗传学、人类生态学、分子进化和考古学有重要的应用意义。
 
mtDNA序列及异质性分析在很大程度上依赖于测序技术。Sanger测序由于流程相对繁琐、分辨率较低、通量不足;在mtDNA异质性应用中往往受限。下一代测序技术(NGS)本质为短读长测序,分析mtDNA需要拼接多个短片段扩增子,扩增效率对异质性比例的识别存在潜在影响。此外,短片段扩增的非特异性容易受到核线粒体DNA(nuclear mitochondrial DNA,NUMT)序列的影响,从而使mtDNA分析变得复杂。
 
作为最新一代基因测序技术,纳米孔测序可利用其读长长、实时测序的天然优势改善或避免以上限制,为异质性检测提供全新的方法和见解。目前,纳米孔测序技术的应用已在多个临床和生物学领域得到了开发,然而,利用该技术进行mtDNA异质性检测的研究报道却还很少。
 
作为国内首家自主研发纳米孔基因测序技术的齐碳科技,QNome平台已被应用于各种生物学研究,平台在微单倍型遗传标记的分型研究结果已发表于Forensic Science International: Genetics (2022, 57, 102657),其法医适用性也得到了初步证实。(点击此处即可跳转阅读原文
 
此次,侯一平教授团队基于齐碳QNome平台,进一步开展纳米孔基因测序技术在线粒体基因组研究的应用探索,以期改善传统测序技术带来的局限性,获得更高准确性的检测结果。
 
成果概述
研究团队首先评估了四种常用的variant callers在人类mtDNA控制区异质性认证中的性能,基于模拟混合两个合成序列( rCRS 和SSHS)样本的QNome纳米孔测序reads产生的不同比例(50:50, 75:25, 80:20, 85:15, 90:10, 95:5)的混合样本。
 
随后,基于QNome测序平台自主开发了mtDNA控制区异质性检测分析框架—CmVCall,该工具整合了多个数据处理程序,可执行读取过滤、去除核线粒体序列(numt)、比对、可选择的“校正”模式和最终的异质性识别,并验证了其在低异质性水平上的表现。
 

Fig1 CmVCall pipeline. 
 
同卵双胞胎(MZ)由于特殊的胚胎发生机制,具有极其相似的遗传特征。从早期的遗传“共识(一致性)”角度来看,他们的遗传信息甚至是完全一样的,无法通过常规的法庭科学DNA检测手段来区分,也对法医调查提出了挑战。在本研究中,为了探究纳米孔测序技术在双胞胎线粒体异质性识别中的潜力,研究团队还使用来自同卵双胞胎(MZ)的血液、唾液和毛发样本进行异质性检测评估,并与NGS平台数据进行比较。
 
成果亮点
1.纳米孔测序结果表明CmVCall具有很高的准确性,可用于纳米孔测序数据mtDNA控制区的异质性检测。使用“无校正”选项,pipeline可以检测到低至10%的异质性水平,而使用“校正”选项,可以准确识别5%的低频异质性位点,精度、准确性和召回率分别为100%、99.9%和92.3%。
 
Fig.2Accuracy, precision, and recall of six simulation ratios with ‘No correction’
Fig.3. Accuracy, precision, and recall of six simulation ratios with ‘Correction’
 
2. 人类线粒体基因组中多聚物(homopolymer)区域的分析一直是生物信息分析学研究中的一个挑战。以往的研究在检测异质性时,通常会丢弃这些区域。为了减少这些区域的错误率,测序生化体系和分析工具均在不断改进中。本研究中,通过纳米孔测序结合pipeline工具的严格过滤,避免了数据分析过程中不必要的“丢弃”,从而获得更高水平的个体间和个体内多态位点。
将QNome平台和Ion Torrent 平台产生的测序数据进行对比,结果显示,两个平台的异质性调用呈现一定程度的一致性。纳米孔测序基于“校正”模式可以比NGS平台识别出更多的异质性,并在具有高覆盖率的多聚物区域也识别出异质性位点,显示出纳米孔测序技术的应用潜力。
 
3.研究团队统计了每对双胞胎三种类型样本之间的mtDNA控制区微小差异。结果表明基于NGS数据,四对MZ双胞胎的两个体可以通过毛发样本的异质性位点被区分开来,而基于QNome校正数据,双胞胎样本的三种样本类型的mtDNA控制区检测出更多的异质性,可以区分全部7对双胞胎样本中的两个体。
Fig. 6. The accuracy, precision, and recall of four analytical tools (CmVCall, LoFreq, LongShot, and marginAlign) under six simulation ratios. This figure is based on QNome correction data.
 
结语
综上所述,CmVCall具有很高的准确性,并且适合用于利用纳米孔测序数据进行mtDNA控制区的异质性检测。在“校正”选项下,5%水平异质性的精度、准确性和召回率分别为100%、99.9%和92.3%。在使用MZ样本的验证和比较中,结果表明,CmVCall可以比NGS能够识别到更多的异质性位点,揭示了个体间和个体内mtDNA细微差别。同时,该研究还鉴定了一些具有极高覆盖率和可信度的homopolymer异质性位点,这意味着利用纳米孔测序和CmVCall检测这些区域的异质性具有潜力。
研究团队表示,针对homopolymer区域的额外验证方法和新工具的不断开发仍然是非常必要的。此次研究的调查样本量仍然较小,预计将基于齐碳纳米孔测序技术继续使用CmVCall分析更多类型的数据集和更大的样本量以进一步进行估计和改进,相信这一工具将为未来开发针对线粒体全基因组的纳米孔测序pipeline奠定坚实基础。

作为国内第一家全面掌握纳米孔测序技术并将之推向商业化的企业,齐碳持续技术研发、扩充产品矩阵,不断解锁更多应用场景,让这项高精尖的技术产生更多的现实生产力。
目前,已经形成了以基因测序仪为核心,配套有试剂、芯片及软件的测序平台。此外还有实验室自动化、生信分析等应用支撑产品,形成了完整的基因测序全链条解决方案。
今年3月,齐碳重磅发布了全新迭代升级的K2体系,带来了更准、更稳、更高效的测序体验。单次准确率从90%跃升至97%,Consensus 准确率(70x)从Q40提升至Q50,不仅 Homopolymer 分辨能力大幅提升,还实现了高精度短序列测序,同时上样量也大幅减少。
8月18日,齐碳时隔一年再发新品,重磅推出自主研发的中通量纳米孔基因测序平台QPursue,从低通量QNome测序平台扩展到中通量测序平台QPursue,不仅展现了齐碳强劲的研发实力和创新能力,也代表着国内纳米孔基因测序技术的最前沿水平。
未来,齐碳科技将持续深耕,不断提升测序性能、降低测序成本,充分挖掘纳米孔测序技术的优势潜能,推动纳米孔测序技术迭代和产业化应用,加速纳米孔基因测序仪国产化时代进程!
 
特别鸣谢四川大学华西基础医学与法医学学院的侯一平教授团队对本文的指导!

参考文献:
[1]Lirong Jiang, Jing Liu,Suyu Li,et,al. CmVCall: an automated and adjustable nanopore analysis pipeline for heteroplasmy detection of the control region in human mitochondrial genome.Forensic Science International: Genetics.Volume 67, November 2023, 102930.

2021年12月,齐碳科技通过5年的自主研发,成功推出国内首台商业化的纳米孔基因测序仪QNome-3841,并宣布首个生产基地竣工,正式开启纳米孔基因测序国产化时代。2022年6月,齐碳科技发布纳米孔基因测序仪QNome-3841hex,标志着国产纳米孔基因测序仪开始了矩阵化发展,这也为灵活测序场景提供全新的解决方案,将更好地满足市场应用的多元需求。
相关文章 更多 >