数据非依赖采集(DIA)质谱法的发展是为了提高复杂数据集中蛋白质鉴定的重现性。PEAKS提供专门的DIA数据分析工作流,其中包括谱图库搜索(SL search)和数据库搜索(DB search)算法,这些算法是为DIA质谱的复杂性而专门设计的。通过对人胚胎肾(HEK)细胞DIA数据的分析,谱图库搜索比常规DDA数据方法具有更好的重现性。与测试的其他方法相比,使用DIA数据进行直接数据库搜索的灵敏度最高。而谱图库搜索和直接数据库搜索在PEAKS工作流中的结合提供了一种既准确、重现性又高的方法。
DIA是采集预设定m/z窗口范围内的所有母离子进行二级碎裂,因此即使样本不进行二维组份分离,也能基本上涵盖所有质量范围。而DDA是通过Top N的方式选择母离子进行碎裂,即使设定多轮扫描,也会丢失一些信号。因此,DIA生成的是无偏的、高度可重复的,但复杂度比较高的谱图数据,通常包含来自几个共洗脱肽段的碎片离子(Fig 1)。
Fig 1. DDA-MS vs. DIA-MS comparison
为了分析DIA数据集的复杂谱图,PEAKS提供了两种分析方法:谱图库搜索(SL search)和直接数据库搜索(DB search)。PEAKS的SL search是从DDA谱图库中找到与DIA数据中特征相匹配的多肽,从而实现鉴定,包括碎片离子特征、索引保留时间(iRT)和离子迁移率(IM)等。PEAKS DIA DB search工作流是直接根据蛋白质序列数据库生成预测的谱图库,然后进行DIA数据的解析。
深度学习预测的多肽信息包括碎片离子、iRT、IM等。SL search和DB search可以单独运行,也可以同时运行。当同时运行时,首先使用SL search进行匹配,然后,在选定的错误发现率(FDR)范围内没有可信匹配的谱图再使用DB search进行分析。
Fig 2. PEAKS Online DIA Workflow
Table1 DDA analysis and Spectral library generation parameters
Parameter | Parameter |
---|---|
Precursor mass tolerance | 10 ppm |
Fragment mass tolerance | 0.02 Da |
Modifications | Carbamidomethylation(Fix) |
Enzyme | Trypsin |
Digestmode | Specific |
Maximum missed cleavage | 3 |
Database | Revieweduniprot human-20230906 |
PSM FDR | 1% |
Protein FDR | 1 |
Minimum unique peptides | 1 |
Table 2 DIA Spectral Library search parameters
Parameter | Parameter |
---|---|
Precursor mass tolerance | 10 ppm |
Fragment mass tolerance | 0.02 Da |
Peptide length | 7-30 |
PSM FDR | 1% |
Protein Group FDR | 1% |
Database |
Reviewed uniprot human-20230906 |
Spectral library | From table 1 |
Table 3 DIA database search parameters
Parameter | Parameter |
---|---|
Precursor mass tolerance | 10 ppm |
Fragment mass tolerance | 0.02 Da |
Modifications | Carbamidomethylation(Fix) |
Enzyme | Trypsin |
Digestmode | Specific |
Maximummissed cleavage | 3 |
Peptide length | 7-30 |
Database | Reviewed uniprothuman-20230906 |
PSM FDR | 1% |
Protein FDR | 1% |
Minimum unique peptides | 1 |
Fig 3. Protein and peptide total number of identifications. Protein and PSM were both within 1% FDR.
Fig 4. DIA library search protein (A) and peptide (B) reproducibility.
Fig 5. DIA database search protein (A) and peptide (B) reproducibility.
Fig 6. DIA Workflow (Spectral library search then DB search) protein (A) and peptide(B) reproducibility.
Fig 7. DDA Database search protein (A) and peptide (B) reproducibility.
PEAKS Online的DIA全工作流(包括谱图库搜索和直接数据库搜索)鉴定到最多的蛋白和多肽(Fig 3)。分别选取三个replicates,对每种方法的定性结果及重现性进行了评估。结果显示谱图库搜索的重现性最高,在蛋白质水平上有95.1%的重复率,在肽段水平上有75.5%的重复率(Fig 4)。
在DIA数据库搜索结果中,灵敏度和重现性之间必然是需要权衡的,它最灵敏,但是重现性相对来说就会比谱图库搜索稍微低一些(92.7%, Fig 5a)。DIA全工作流在重现性和灵敏度之间达成了最佳组合 (Fig 6)。与DDA数据库搜索方法相比,DIA搜索方法的灵敏度和重现性都更高(Fig 4-7)。
若您想了解更多PEAKS软件的功能和应用,欢迎扫描下方二维码关注我们!
1.Fernández-Costa C, Martínez-Bartolomé S, McClatchy DB, Saviola AJ, Yu NK, Yates JR 3rd. Impact of the Identification Strategy on the Reproducibility of the DDA and DIA Results. J Proteome Res. 2020 Aug 7;19(8):3153-3161.doi: 10.1021/acs.jproteome.0c00153. Epub 2020 Jun 19. PMID: 32510229; PMCID: PMC7898222.
www.bioinfor.com (EN)
www.deepproteomics.cn(CN)
作为生物信息学的领军企业,BSI专注于蛋白质组学和生物药领域,通过机器学习和先进算法提供世界领先的质谱数据分析软件和蛋白质组学服务解决方案,以推进生物学研究和药物发现。我们通过基于AI的计算方案,为您提供对蛋白质组学、基因组学和医学的卓越洞见。旗下著名的PEAKS系列软件在全世界拥有数千家学术和工业用户,包括:PEAKS Studio,PEAKS Online,PEAKS GlycanFinder, PEAKS AB及抗体综合表征服务等。
联系方式:021-60919891;sales-china@bioinfor.com