文章

PolySeq.AI利用3种质谱技术实现多克隆抗体从头测序99%+准确率

2025-10-21     来源:本站     点击次数:102

首个多克隆抗体从头测序软件!PolySeq.AI利用3种质谱技术实现99%+准确率

你有没有想过:为什么有些抗体能对抗病毒突变,却一直没法大规模用在新药里?答案源自多克隆抗体(pAb)”的特性,它能识别抗原的多个位点,比单克隆抗体(mAb)更抗突变,却因为成分太复杂,一直面临“测序难”的困境:要么依赖稀缺的B细胞,要么靠现有数据库“猜”,结果又慢又不准,而且通过质谱直接测序,数据又过于复杂几乎无法拼接。但在我们Bioinformatics Solutions Inc.(BSI)研究团队的不断努力下,这个卡脖子多年的难题终于迎来了重大突破!10月13日,题为“Sequencing of Polyclonal Antibodies by Integrating Intact Mass, Middle-Down and De Novo Bottom-Up Mass Spectrometry”的文章正式上线Molecular & Cellular Proteomics,将bottom-up、middle-down和intact mass质谱技术“三招联用”,实现了多克隆抗体的全自动、无数据库测序,准确率高达99%+,开启多克隆抗体新药研发的新纪元!

BSI团队的Lei Xin, Wenting Li , Shuyang Zhang 为共同第一作者,Baozhen Shan和Ming Li院士为本文通讯作者,该工作囊括了算法,软件开发,液相分离技术和质谱多个小组的共同协作。

图1 PolySeq.AI流程示意图


先搞懂:多克隆抗体为啥“好用却难测”?
首先,要了解“单克隆”和“多克隆”的区别:
◆单克隆抗体(mAb):成分单一,能精准盯紧一个抗原位点,测序容易、批次稳定,是现在很多抗癌药、单抗药的首选。
◆多克隆抗体(pAb):是B细胞“批量生产”的混合抗体,能同时盯紧抗原的多个位点,这意味着它更能适应病毒突变(比如新冠变异株),还能检测低浓度抗原,在抗蛇毒血清、ELISA检测里非常适用。


图2 单抗和多抗的结合示意

pAb的“混合性”在结合广泛的同时,也带来了硬伤,那就是成分复杂、批次差异大,想测清楚它的氨基酸序列,以前要么靠“查字典”(比对已知的B细胞数据库,很多时候还查不到),要么靠手动拼接,不仅慢,还容易出错,直接限制了它在新药里的应用。
 


PolySeq.AI的“破局秘诀”:三招质谱技术联用
PolySeq.AI的核心优势,就是真正的实现了不依赖任何外部数据库,只靠质谱数据完成多抗序列的解析和拼接,而且全程自动化的从头测序,将湿实验和数据分析有机结合。它的操作逻辑可以总结为“先拆后拼,层层验证”(图3)。

图3 结合intact mass、bottom-up、middle-down的pAb从头测序分析流程

Step 1样本制备及三种质谱数据采集
先把抗体样本进行预处理(比如切糖、切开铰链区等),然后用三种质谱技术分别获取关键信息:

◆Intact Mass:看抗体的整体分子量,大致确定有多少种抗体形式,指导后续实验方向及为后续算法拼接提供依据;
◆Middle-down:把抗体拆成20-30kDa的中等片段(比如轻链、Fc片段),捕捉片段的关键结构信息;
◆Bottom-up:把抗体拆成更小的肽段,像拼图的小碎片一样,为后续拼接提供 “细节素材”。

Step 2AI算法“智能拼图”
拿到三种质谱数据后,PolySeq.AI根据以下步骤完成拼接,整个过程无需借助任何数据库,以前需要一个经验丰富的专家花十天半个月都不一定能处理完的工作,现在只需几小时就能搞定。
用bottom-up的多肽构建“重叠图库”,先拼出初步序列;
用middle-down的片段信息“校准”,筛选出最匹配的序列组装路径;
最后用intact mass数据“收尾”,把中等片段拼成完整的抗体链(轻链、重链),最后还能自动纠正氨基酸的错配问题(比如区分亮氨酸Leu和异亮氨酸Ile,N和GG这类isobaric错误)。

硬核验证:两组实验结果“实锤”准确率
光说不练假把式,我们的实验团队用两组不同的实验直接验证了PolySeq.AI的实力。

实验1:HB-95细胞系的抗体混合物
HB-95细胞系能产生针对HLA-I复合物的抗体,用单克隆抗体测序方法只能测出部分序列,但从intact mass的解卷积结果中,可以明确看到有3种组合形式(图4)。用PolySeq.AI方案不仅准确组装出了3种完整的抗体形式(2种轻链+1种重链的组合),并且与NCBI数据库比对,我们给出的序列与已知的抗体片段匹配率达到了100%。然后,我们把测序结果通过重组表达后,产物能精准结合HLA-I复合物,足以证明准确性。

图4 HB95 intact mass解卷积的三种抗体组合

实验2:4种已知单抗的模拟混合液测序
我们把4种临床常用的单抗:贝伐单抗(Avastin)、阿达木单抗(Humira)、利妥昔单抗(MabThera)和曲妥珠单抗(赫赛汀),按3:2:1:1比例混合,模拟复杂的多克隆抗体环境,通过PolySeq.AI实现了超过99%的测序准确率含量低于5%的抗体也能准确测定。其中,bottom-up的肽段覆盖度达到100%,middle-down的片段匹配度也超过了50%。

图5 四种抗体混合物的测定序列


PolySeq.AI的突破,到底意味着什么?
PolySeq.AI的突破贡献,不仅仅只是“测准了序列”,更给生物医药领域带来了两个关键改变:
解决pAb的“批次难题”:以前pAb因为序列不清,批次差异大,没法大规模用于临床;现在能精准测序,就能通过重组技术批量生产“标准化”的pAb,使得抗蛇毒血清、抗病毒cocktail疗法等都能更稳定的应用。
加速新药研发:对于未知的抗体(比如新病毒的中和抗体),不用再花费大量的时间和费用成本寻找B细胞、建数据库,关键是避免搜库的偏向性,直接用PolySeq.AI测序,就能快速拿到序列,极大地加快了后续药物的研发过程。


从“测不准”、“测不了”到“99%+准确率”,PolySeq.AI靠“三招质谱技术+AI拼图”,终于把多克隆抗体的“密码本”破译了。这不仅是质谱技术和AI结合的胜利,更让我们看到,那些曾经因为复杂、难测而让科学家们束手无策的生物大分子,未来真的有可能成为造福疾病患者的良药。未来,我们会进一步提升低丰度抗体的检测灵敏度,甚至拓展到更复杂的蛋白质混合物测序,为对抗传染病、癌症增添一把“精准武器”。


作为生物信息学的领军企业,BSI专注于蛋白质组学和生物药领域,通过机器学习和先进算法提供世界领先的质谱数据分析软件和蛋白质组学服务解决方案,以推进生物学研究和药物发现。我们通过基于AI的计算方案,为您提供对蛋白质组学、基因组学和医学的卓越洞见。旗下著名的PEAKS®️系列软件在全世界拥有数千家学术和工业用户,包括:PEAKS®️ Studio,PEAKS®️ Online,PEAKS®️ GlycanFinder, PEAKS®️ AB,ProteoformXTM,DeepImmu®️ 免疫肽组发现服务和抗体综合表征服务等。联系方式:021-60919891;sales-china@bioinfor.com
相关文章 更多 >