关注康昱盛官方公众号,了解产品更新&活动通知
Sentieon
Enabling precision data for precision medicine
——基因组数据快速二级分析工具
产品简介
Sentieon提供了二代测序分析的完整解决方案,基于BWA、GATK、HaplotypeCaller、Mutect和Mutect2的分析流程进行了大幅提升,可以部署在任何基于通用CPU的系统结构之上。Sentieon经历了大量用户的测试和验证,处理过上百万样本,总计超过4万亿bp的DNA。
常见客户
- 基因组测序服务供应商
- 分子诊断公司
- 药物和生物技术公司
- 医院和癌症中心
- 对接消费者的基因公司
- 学院和研究机构
突出特点
- 加速的BWA-MEM和GATK兼容流程。整合了BWA-MEM、Picard和GATK3.3-4.1, 可以做“Broad Institute Best Practices Pipelines”中的任意计算方式的替代。
- 极速周转时间和超低成本。对于一个30X WGS全基因组测序(Whole Genome Sequencing, WGS)流程,在分布式计算处理中流程小于30分钟,在单个服务器中流程小于2小时。大大减少了运算时间和成本,同时结果与 BWA/GATK保持一致。
- 100%一致性。无下采样(Down-Sampling),无线程依赖性,无run-to-run差异。Sentieon在FDA举办的基因测序数据挑战赛PrecisionFDA Consistency Challenge中的整体性能和和可重复性方面取得好成绩。
- 部署简单。Sentieon为纯软件解决方法,可以在任何基于通用CPU的电脑系统上运行,十分容易部署在本地或者云端。
- 竞赛获奖级别的准确性。Sentieon为PrecisionFDA基因测序数据挑战赛中PrecisionFDA Truth Challenge,Hidden Treasure Warm-Up Challenge,NCI-CPTAC Multi-omics Enabled Sample Mislabeling Correction Challenge和ICGC-TCGA DREAM Somatic Mutation Calling Challenge的获胜者。
- 企业支持。Sentieon的科学家和工程师为企业用户全心全力提供支持。
Sentieon分析流程与工具
1.序列比对(Alignment):Sentieon BWA相对于BWA-MEM的速度提升到2倍
2.生殖细胞SNV/INDEL变异识别(Germline SNV/INDEL Variant Calling):DNAseq:获得PrecisionFDA奖项的软件,功能匹配GATK3.3-4.1,没有下采样过程(Downsampling),每次获得结果的速度可以提升到10倍并保持100%的一致性。DNAscope:提高的准确性和基因组表征。增强的机器学习方法能够以高准确性识别产生的变异
3.体细胞SNV/INDEL变异识别(Somatic SNV/INDEL Variant Calling):TNseq:匹配MuTect,MuTect2 v3.8-4.0,为达到更高的准确性和针对低等位基因频率的变异更高的检测能力,没有下采样过程(Downsampling)
TNscope:ICGC-TCGA DREAM竞赛冠军。提升的准确性,针对变异筛选增强的机器学习方法。支持分子条码和唯一的分子识别码
4.结构变异识别(Structural Variant Calling):生殖细胞和体细胞结构变异识别,包括易位、倒置、复制和大的INDEL
5.队列研究(Joint Calling):支持超过20w全基因组样本的大型队列研究,可直接从gVCF开始,无需任何中间步骤
6.BCL-FASTQ转化工具(BCL-FASTQ Tool):Sentieon外部的数据库加速BCL到FASTQ的转化,速度可达1.5到2倍。
7.RNA变异识别(RNA Variant Calling):匹配GATK RNAseq变异识别的方法
Sentieon DNAseq(强大稳定的生殖细胞变异检测工具)
- 与Broad Institute的BWA-GATK Best Practice Workflow一致的算法流程,但以核心小时计算,在FASTQ到VCF文件的流程中速度高10倍,在BAM到VCF文件的流程中速度高20倍。
- 无run-to-run差异,在高覆盖区域无下采样。
- 在大型数据(>200K样本)中的Joint-Calling中不合并中间文件。
- 与常见疾病基因组中心(Centers for Common Disease Genomics)具有等效功能。
- 纯软件解决方案,可以运行在任何基于通用CPU的系统中。
- PrecisionFDA Consistency Challenge获奖者。
- PrecisionFDA Truth Challenge获奖者。
- PrecisionFDA Hidden-Treasure Warm-Up Challenge获奖者。
- 在Google Cloud的64核服务器FASTQ-to-VCF流程性能:30X 基因组,NA12878(HG001)2小时分析完毕(140核心小时)
与Broad Institute的BWA-GATK Best Practice Workflow一致的算法流程,但以核心小时计算,在FASTQ到VCF文件的流程中速度高10倍,在BAM到VCF文件的流程中速度高20倍。
无run-to-run差异,在高覆盖区域无下采样。
在大型数据(>200K样本)中的Joint-Calling中不合并中间文件。
与常见疾病基因组中心(Centers for Common Disease Genomics)具有等效功能。
纯软件解决方案,可以运行在任何基于通用CPU的系统中。
PrecisionFDA Consistency Challenge获奖者。
PrecisionFDA Truth Challenge获奖者。
PrecisionFDA Hidden-Treasure Warm-Up Challenge获奖者。
在Google Cloud的64核服务器FASTQ-to-VCF流程性能:30X 基因组,NA12878(HG001)2小时分析完毕(140核心小时)
Sentieon TNseq(强大稳定的体细胞变异检测工具)
- 与Broad Institute的MuTect和MuTect2一致的算法流程,但以核心小时计算,在FASTQ到VCF文件的流程中速度高10倍,同时无下采样。
- 无run-to-run差异,在高覆盖区域无下采样。
- 纯软件解决方案,可以运行在任何基于通用CPU的系统中。
Sentieon TNseq是匹配的肿瘤-正常或者仅肿瘤体细胞变异检测工具,其算法和MuTect和MuTect2相匹配。Sentieon TNseq使用Broad Institute中同样的算法,通过高效计算算法和企业级软件实现获得性能的提高。
Sentieon TNseq在核心小时方面提速10倍以上,无run-to-run差异,在高覆盖区域不进行下采样,结果更加稳定。除了提高WGS或者全外显子组 (Whole Exon Sequencing, WES)样本的体细胞变异检测,Sentieon TNseq特别使高覆盖区域的体细胞变异检测成为可能,例如在液体活检中,这是由于Sentieon TNseq可以在无下采样的情况下的处理覆盖深度超过100K的区域。
Sentieon TNseq被设计为可以进行多项成和分布式处理。
Sentieon TNscope(精准综合性肿瘤表征)
- 综合性体细胞变异检测,在仅肿瘤样本或肿瘤-正常样本中检测SNV、INDEL和SV。
- 无run-to-run差异,在高覆盖区域无下采样。
- 纯软件解决方案,可以运行在任何基于通用CPU的系统中。
- 在ICGC-TCGA Dream Mutation Calling Challenge 6的三组分类中(SNV, INDEL, SV)排名前列。
Sentieon TNscope基于MuTect和MuTect2构建提升数学模型。使用数学模型中复杂的信号传导技术来积累信号同时去除噪声。TNscope在变异检测中提高信号到噪声比率,相对同类软件收获更高的敏感性和特异性。所有的变异类别都可以被同时检测和表征,包括SNV、INDEL和结构变异(Structure Variants),避免了运行多个变异检测工具的需要。
Sentieon参加了ICGC-TCGA举办的DREAM Challenge benchmarking tumor-normal somatic variant calling accuracy,使用TNscope的工程版本,并在三类比赛中均领先:SNV、INDEL和SV。在最终排行榜中,Sentieon在SNV分类中获得98.57%的F-score、INDEL分类获得98.14%、SV分类获得100%。
Sentieon TNscope被设计为可以进行多项成和分布式处理。