糖蛋白占人类蛋白质和大多数生物制药产物的50%以上,蛋白质糖基化作为最广泛和最复杂的翻译后修饰(PTM)之一,对调节各种生物过程至关重要。糖蛋白序列的综合分析,包括糖基化位点和相关聚糖结构的深度剖析,是糖蛋白功能研究的关键。液相色谱-质谱法(LC-MS/MS)已成为蛋白质鉴定和翻译后修饰发现的强大工具。与糖蛋白质组学中广泛使用的数据库搜索的策略不同,蛋白质从头测序无需事先了解DNA/氨基酸序列,用于未知蛋白的序列测定。然而,多糖基化位点的复杂性通常会使得质谱很难获得信息丰富的糖肽碎片离子,导致序列覆盖不完整和游离寡糖修饰谱不明确,从而影响从头测序的准确性。
2025年初,上海药物研究所的周虎研究员和文留青研究员联合在Analytical Chemistry期刊联合发表了一种结合质谱蛋白质从头测序技术解码未知糖蛋白的新方法:Decoding Protein Glycosylation by an Integrative Mass Spectrometry-Based De Novo Sequencing Strategy,方案设计见图1。Fetuin-A(UniProt Accession no.P12763)是一种含有唾液酸化N糖和O糖的常用模型糖蛋白,作者首先基于Fetuin-A,用糖苷酶切除糖链后采集质谱数据,使用PEAKS® AB完成蛋白质序列的自动组装,建立了糖蛋白的从头测序方法,可获得去糖基化蛋白的一级序列。接下来,使用高度复杂的糖基化蛋白药物依那西普来验证该方法的性能。随后,作者应用该方法鉴定了三种未知 TNFR:Fc 融合生物制剂的氨基酸序列,以探索它们与原研药物依那西普的相似性。并且,从N糖基化位点、游离糖、糖蛋白亚单位、糖肽的多个层面进行了深度糖基化表征,以精确定位 N−/ O-糖基化。该方法弥合了从头测序和糖基化修饰分析之间的差距,提供了有关糖蛋白一级结构和糖基化修饰的全面信息,在基础研究和生物制药行业均具有实用价值。
图1 方案设计示意图
方法与结果
糖蛋白从头测序方法开发
使用PNGase F和O-糖苷酶 EngEF 分别去除Fetuin A上的 N糖和O糖,然后通过Intact Mass验证糖基化切除效果。去除聚糖后,大多数酶切的序列覆盖率显著提高,chymotrypsin、Glu-C、pepsin和trypsin的序列覆盖率均可达到90% 以上。考虑到不同酶切位点的互补性,后续将LysC、Elestase、chymotrypsin、Glu-C、pepsin和trypsin6种酶结合使用,结果如预期,去糖后的序列可信度进一步提升。去除糖基后,糖肽骨架的鉴定更可靠,PEAKS® AB可直观展示切糖前后的序列覆盖情况(图2)。

图2 PEAKS
® AB序列覆盖图
获得足够丰富的多肽碎片离子对于揭示蛋白质相邻氨基酸的序列至关重要。EThcD碎裂可显著增加MS/MS谱图中丰富的碎片离子,有利于多肽序列和翻译后修饰的鉴定,因此作者评估了EThcD碎裂方法与常用的阶梯式HCD碎裂方法。结果表明,尽管de novo候选肽的总数少于HCD 方法,但 EThcd在肽序列长度(图 3B)和谱图质量(图 3C)方面更优,EThcD谱中较长的多肽对于蛋白质序列的组装有利(图3D-E)。更重要的是,考虑到测序准确度,EThcD方法的平均序列准确度高达98.3%的,而HCD的平均准确度为95.8%且包含1个gap(图3F)。
图3 Fetuin A蛋白测序实验方法比较
蛋白质测序中,Ile-Leu(I-L)和Asn-Asp(N-D)的确证往往需要更多的谱图信息。PNGase F切除N糖后,会将糖基化Asn残基转化为Asp,EThcD和HCD均可较好的鉴定出来。N-糖基化的Asn残基可以通过18O标记的肽图分析法以及基于糖苷酶的方法进行确定。值得注意的是,EThcD 方法在Leu/Ile测定方面具备独特的优势,利用EThcD谱图中w离子与z离子的质量差(Leu,-43.05 Da;Ile,-29.04 Da),可明确鉴定蛋白序列中的I和L(例如肽 DIEIDTLETTCH,图4)。
综合以上结果,作者明确了蛋白质测序的基本实验方法,即切糖与EThCD采集方法结合。

图4 EThcD示例肽段
依那西普从头测序
为了测试前述蛋白质从头测序方法的稳健性并证明在高度糖基化生物制药中的应用效果,作者对已上市的治疗性Fc融合蛋白原药依那西普进行从头测序。作为最复杂的高度糖基化Fc 融合生物药物之一,依那西普具有至少3个N-和13个O-糖基化位点。对依那西普切除糖基化后,通过 EThcD 碎裂方法获得MS/MS谱图,用PEAKS® AB完成蛋白质自动测序。三个重复样本的测序结果的覆盖度均达到98.93%,准确度为99.57-100%(表 1)。同时,不切糖的常规策略无法完成序列组装,可能是因为高度糖基化导致MS/MS谱过于复杂,形成的序列gap较多,无法通过从头测序算法和多酶酶切的方法解决(图 5)。且未覆盖的区域位于铰链区,这在人类蛋白质组数据库中是不存在的,这表明使用标准数据库搜索方法推断高度糖基化蛋白的全长一级序列具有挑战性。总之,本研究方法能够对糖蛋白进行从头测序,并实现糖基化修饰区域的深度覆盖。
表1 依那西普切糖测序重复性
图5 不切糖的依那西普多酶酶切
未知TNFR:Fc融合生物制剂的从头测序
应用上述方法对三种依那西普的生物仿制药TNFR:Fc融合生物制剂进行测序。Intact Mass结果显示,TNFR:Fc 2和TNFR:Fc 3与依那西普存在细微差异,而TNFR:Fc 1的完整质量与依那西普相同。与之对应,这三个生物制剂的测序结果显示,有三个氨基酸存在差异,即M174R(在TNFR片段中), E376D 和M378L(均在 Fc片段中)(图 6A),对应于变异位点的 MS/MS谱图碎片离子质量均较高(图 6B-E)。此外,蛋白质序列的差异与完整的蛋白质质量一致(图 6F-G)。M174R上的序列变异是人TNFR 2编码区的多态性导致的,根据报道,应该与多囊卵巢综合征、高雄激素血症和系统性红斑狼疮有关。同样,在市售的TNF 2受体-Fc 融合蛋白产品中也报道了Fc片段的E376D和M378L突变。我们使用 PEAKS® AB软件的Sequence Validation工作流验证了三个TNFR:Fc融合生物制剂蛋白序列。∼99%的序列的可信度>85%,且每条肽段均有多张谱图支持。因此,该结果证实了从头测序结果的高精度。
图6 未知TNFR:Fc融合蛋白测序
TNFR:Fc融合生物制剂的N-/O-糖基化分析
作者从N-糖基化位点鉴定、游离糖、糖蛋白亚基和糖肽多个水平对TNFR:Fc融合制剂进行了全面的N和O糖基化剖析。首先通过18O标记对N糖基化位点进行定量(图7A)。通过计算18O位点所在肽段的强度,在四个TNFR:Fc 融合蛋白样品中筛选出三个N-糖基化位点(N149、N171 和 N317)(图 7B),这三个N糖基化位点与依那西普中已知的N糖基化位点完全匹配。此外,作者通过内切糖苷酶混合物(Endo CC、Endo S 和 Endo H)部分裂解 N糖,产生带有"GlcNAc"/"GlcNAc−Fuc" 的N位点碎片,以确认N-糖基化位点的鉴定结果(图 7A、C)。使用酶切特异性更广的糖苷酶混合物,对N糖链进行充分切割,结果与18O标记高度一致(图 7D)。这些结果均可用于验证从头测序结果中的Asn或Asp。

图7 N糖基化位点鉴定
为了在整个蛋白质水平上确定N糖的含量和结构,作者又用2-AB标记对酶促释放的N糖进行衍生化,然后通过UPLC-HILIC-FLR-MS 进行荧光和质谱检测。依那西普释放的N糖中,最丰富的峰是 F(6)G2F(双天线,核心岩藻糖基化,具有两个末端半乳糖),其次是 F(6)G0F(双天线,核心岩藻糖基化,无末端半乳糖残基),G2(双天线,具有两个末端半乳糖残基),以及 F(6)G1F(双天线,核岩藻糖基化,带有一个末端半乳糖残基)(图 8A)。三种TNFR:Fc融合生物制剂的结果与依那西普相似。然后,作者去除O糖和唾液酸,在亚基水平上评估了N糖的不同糖型。依那西普/TNFR:Fc 1的TNFR片段处丰度最高的糖型为G2 和 G2F(图 8B)。而TNFR:Fc 3的TNFR片段除了主要糖型G2和G2F外,还包含许多G1F(图 8C)。另一方面,尽管观察到微小程度的赖氨酸丢失修饰,但在四个样品中,Fc片段处最突出的糖型均为G0F和G1F。
为了降低糖肽的复杂性和可变性,提高糖肽的酶切效率,作者将唾液酸酶与N-糖苷酶或O糖苷酶结合使用,以深入了解位点特异性 N-/O-糖基化。结果如图8D,即N149、N171 和 N317 糖基化位点主要被G2、G2F 和G0F占据。N171是导致TNFR:Fc 3糖型差异的位点,含有大量的G1F。位点特异性N-糖肽结果与基于亚基水平的糖型分配一致,验证了不同酶切水平下结果的一致性。
结合手动校验糖肽谱图,作者鉴定出了依那西普和3个TNFR:Fc 融合生物制剂上的13个O-糖基化位点(图 8E)。与之前的报道的12个O-糖基化位点一致。在TNFR:Fc融合生物制剂中观察到类似的糖基化模式。此外,对糖基化位点的分析揭示了铰链区的高度糖基化(图 8F)。尽管依那西普和 TNFR:Fc 融合生物制剂在骨架上存在结构相似,但由于不同的制造工艺和细胞来源,它们在糖谱上表现出差异。这些发现突出了潜在的物理化学意义,值得进一步研究,并有助于依那西普及其生物仿制药的全面表征。
图8 依那西普与融合制剂的糖型表征
原文链接:https://pubs.acs.org/doi/10.1021/jacsau.4c00960?ref=PDF
若您想深入了解PEAKS® AB的功能和应用,可点击“阅读原文”提交您的咨询信息。


-扫码关注-
www.bioinfor.com (EN)
www.deepproteomics.cn(CN)
作为生物信息学的领军企业,BSI专注于蛋白质组学和生物药领域,通过机器学习和先进算法提供世界领先的质谱数据分析软件和蛋白质组学服务解决方案,以推进生物学研究和药物发现。我们通过基于AI的计算方案,为您提供对蛋白质组学、基因组学和医学的卓越洞见。旗下著名的PEAKS
®️系列软件在全世界拥有数千家学术和工业用户,包括:PEAKS
®️ Studio,PEAKS
®️ Online,PEAKS
®️ GlycanFinder, PEAKS
®️ AB,DeepImmu
®️ 免疫肽组发现服务和抗体综合表征服务等。
联系方式:021-60919891;sales-china@bioinfor.com