PEAKS Online DIA谱图库与direct Database整合分析详解

2024-03-22 来源:本站点击次数:2131

摘要

数据非依赖采集(DIA)质谱法的发展是为了提高复杂数据集中蛋白质鉴定的重现性。PEAKS提供专门的DIA数据分析工作流，其中包括谱图库搜索（SL search）和数据库搜索（DB search)算法，这些算法是为DIA质谱的复杂性而专门设计的。通过对人胚胎肾(HEK)细胞DIA数据的分析，谱图库搜索比常规DDA数据方法具有更好的重现性。与测试的其他方法相比，使用DIA数据进行直接数据库搜索的灵敏度最高。而谱图库搜索和直接数据库搜索在PEAKS工作流中的结合提供了一种既准确、重现性又高的方法。

简介

DIA是采集预设定m/z窗口范围内的所有母离子进行二级碎裂，因此即使样本不进行二维组份分离，也能基本上涵盖所有质量范围。而DDA是通过Top N的方式选择母离子进行碎裂，即使设定多轮扫描，也会丢失一些信号。因此，DIA生成的是无偏的、高度可重复的，但复杂度比较高的谱图数据，通常包含来自几个共洗脱肽段的碎片离子(Fig 1)。

Fig 1. DDA-MS vs. DIA-MS comparison

为了分析DIA数据集的复杂谱图，PEAKS提供了两种分析方法：谱图库搜索（SL search）和直接数据库搜索（DB search）。PEAKS的SL search是从DDA谱图库中找到与DIA数据中特征相匹配的多肽，从而实现鉴定，包括碎片离子特征、索引保留时间(iRT)和离子迁移率(IM)等。PEAKS DIA DB search工作流是直接根据蛋白质序列数据库生成预测的谱图库，然后进行DIA数据的解析。

深度学习预测的多肽信息包括碎片离子、iRT、IM等。SL search和DB search可以单独运行，也可以同时运行。当同时运行时，首先使用SL search进行匹配，然后，在选定的错误发现率(FDR)范围内没有可信匹配的谱图再使用DB search进行分析。

Fig 2. PEAKS Online DIA Workflow

方法

使用最新的PEAKS Online重新分析PXD008235数据集^[1]。文献采用Q-Exactive质谱仪(Thermo Fisher)对3微克HEK293蛋白酶解样品进行了多种方法的分析。采用DDA方法分析11个重复;其中8个用于建立谱图库(Table 1)，3个用于测试DDA方法的重现性和灵敏度，使用PEAKS DB进行检索。另取3个重复使用DIA方法进行分析，并使用PEAKS谱图库（SL）和DIA直接数据库检索进行检索(Table 2和Table 3)。

Table1 DDA analysis and Spectral library generation parameters

Parameter	Parameter
Precursor mass tolerance	10 ppm
Fragment mass tolerance	0.02 Da
Modifications	Carbamidomethylation（Fix）
Enzyme	Trypsin
Digestmode	Specific
Maximum missed cleavage	3
Database	Revieweduniprot human-20230906
PSM FDR	1%
Protein FDR	1
Minimum unique peptides	1

Table 2 DIA Spectral Library search parameters

Parameter	Parameter
Precursor mass tolerance	10 ppm
Fragment mass tolerance	0.02 Da
Peptide length	7-30
PSM FDR	1%
Protein Group FDR	1%
Database	Reviewed uniprot human-20230906
Spectral library	From table 1

Table 3 DIA database search parameters

Parameter	Parameter
Precursor mass tolerance	10 ppm
Fragment mass tolerance	0.02 Da
Modifications	Carbamidomethylation（Fix）
Enzyme	Trypsin
Digestmode	Specific
Maximummissed cleavage	3
Peptide length	7-30
Database	Reviewed uniprothuman-20230906
PSM FDR	1%
Protein FDR	1%
Minimum unique peptides	1

结果

Fig 3. Protein and peptide total number of identifications. Protein and PSM were both within 1% FDR.

Fig 4. DIA library search protein (A) and peptide (B) reproducibility.

Fig 5. DIA database search protein (A) and peptide (B) reproducibility.

Fig 6. DIA Workflow (Spectral library search then DB search) protein (A) and peptide(B) reproducibility.

Fig 7. DDA Database search protein (A) and peptide (B) reproducibility.

PEAKS Online的DIA全工作流（包括谱图库搜索和直接数据库搜索）鉴定到最多的蛋白和多肽(Fig 3)。分别选取三个replicates，对每种方法的定性结果及重现性进行了评估。结果显示谱图库搜索的重现性最高，在蛋白质水平上有95.1%的重复率，在肽段水平上有75.5%的重复率(Fig 4)。

在DIA数据库搜索结果中，灵敏度和重现性之间必然是需要权衡的，它最灵敏，但是重现性相对来说就会比谱图库搜索稍微低一些(92.7%, Fig 5a)。DIA全工作流在重现性和灵敏度之间达成了最佳组合 (Fig 6)。与DDA数据库搜索方法相比，DIA搜索方法的灵敏度和重现性都更高(Fig 4-7)。

若您想了解更多PEAKS软件的功能和应用，欢迎扫描下方二维码关注我们！

参考文献

1.Fernández-Costa C, Martínez-Bartolomé S, McClatchy DB, Saviola AJ, Yu NK, Yates JR 3rd. Impact of the Identification Strategy on the Reproducibility of the DDA and DIA Results. J Proteome Res. 2020 Aug 7;19(8):3153-3161.doi: 10.1021/acs.jproteome.0c00153. Epub 2020 Jun 19. PMID: 32510229; PMCID: PMC7898222.

近期活动及回放:
BSI廿四年生信路，与您共探生命密码
合作文章 | PEAKS QC功能和蛋白变化趋势设计结合实现最准确的TMT定量
应用实例丨PEAKS Online TMT标记定量数据分析应用
应用实例丨PEAKS 11中免疫肽组学分析完整工作流

产品推荐:
PEAKS Studio--兼容DDA和DIA的蛋白质组学研究的质谱数据一站式软件平台
PEAKS Online -- 基于服务器的高通量蛋白质质谱数据全流程自动化解决方案
PEAKS AB--全球第一个抗体全自动化测序软件解决方案
PEAKS GlycanFinder--结构分辨的糖蛋白组深度分析软件

-扫码关注-

www.bioinfor.com (EN)

www.deepproteomics.cn（CN）

作为生物信息学的领军企业，BSI专注于蛋白质组学和生物药领域，通过机器学习和先进算法提供世界领先的质谱数据分析软件和蛋白质组学服务解决方案，以推进生物学研究和药物发现。我们通过基于AI的计算方案，为您提供对蛋白质组学、基因组学和医学的卓越洞见。旗下著名的PEAKS系列软件在全世界拥有数千家学术和工业用户，包括：PEAKS Studio，PEAKS Online，PEAKS GlycanFinder, PEAKS AB及抗体综合表征服务等。

联系方式：021-60919891；sales-china@bioinfor.com

相关公司：百蓁生物科技（上海）有限公司
联系电话：021-60919881
邮箱: sales-china@bioinfor.com