文章

人工智能(AI)和机器学习(ML)驱动下的ADC设计优势、应用及面临挑战

2025-08-25     来源:paper     点击次数:44

文章来源公众号:paper Club 作者:aper Club

核心总结
本表整理自2025年最新ADC综述文献,整合了抗体-药物偶联物(ADC)领域的前沿进展,强调了AI与机器学习技术在生物制药中的深度融合。核心内容包括结构预测工具如AlphaFold3DiffAb的突破,亲和力优化及从头设计模型如RefineGNNIgDiff的进步,结合位点预测工具如EquiPocket的应用,以及ADC活性预测框架ADC-net的发展。此外,集成数据库ADCdb为研究提供了坚实基础,而VERISIM Life等平台则预示着向全流程AI设计管线的转变,体现了AI正成为驱动ADC理性设计的核心引擎。这些进展标志着药物研发范式的重大变革。

引言:从“魔法子弹”到靶向治疗新时代
抗体-药物偶联物(Antibody-Drug Conjugates, ADCs)是现代癌症治疗领域中一种高度复杂的靶向治疗药物,它将单克隆抗体(mAb)的特异性与小分子细胞毒性药物的强效杀伤能力相结合,实现了对癌细胞的精准打击,同时最大限度地减少对健康组织的损害。这一理念最早可追溯至德国化学家保罗·埃尔利希(Paul Ehrlich)在20世纪初提出的“魔法子弹”(zauberkugel)概念,即设想一种能够特异性识别并摧毁病原体而不伤害宿主细胞的治疗剂。尽管这一设想在当时未能实现,但它为现代靶向治疗奠定了理论基础。

经过近一个世纪的发展,ADCs终于从理论走向临床。2000年,首个ADC药物吉姆单抗-奥佐米星(gemtuzumab ozogamicin,商品名Mylotarg®)获得美国FDA批准,用于治疗急性髓系白血病(AML),标志着ADC时代的正式开启。此后,随着抗体工程、连接子化学和细胞毒性载荷技术的不断进步,ADCs的研发进入快速发展期。截至2021年,已有9款ADC药物获得FDA批准用于临床,涵盖多种癌症类型,包括淋巴瘤、乳腺癌、尿路上皮癌等。目前,全球范围内有超过360项关于ADC的临床试验(I至IV期)正在进行,主要评估其安全性和有效性,显示出该领域巨大的发展潜力和广阔的市场前景。

核心组成:ADC由三个关键部分构成——单克隆抗体、连接子(linker)和细胞毒性载荷(payload)。这三者协同作用,共同决定了ADC的靶向性、稳定性和疗效。单克隆抗体负责识别并结合肿瘤细胞表面的特定抗原;连接子作为桥梁,将抗体与载荷稳定连接,并在特定条件下释放药物;而细胞毒性载荷则是在进入肿瘤细胞后发挥杀伤作用的关键“弹头”。

单克隆抗体:ADC的“导航系统”
抗体的基本结构与功能

抗体,也称为免疫球蛋白,是一种Y形的大型糖蛋白,是人体免疫系统对抗细菌、病毒等病原体的“守护者”。由浆细胞(由活化的B淋巴细胞发育而来)产生,抗体能够特异性地结合病原体表面的抗原,通过直接中和病原体或标记病原体供免疫系统其他成分清除来发挥作用。天然抗体是多克隆的,由不同浆细胞系产生,识别多种抗原。而在治疗应用中,通常使用单克隆抗体(mAb),即由单一B细胞克隆产生的、针对特定抗原表位的抗体。

单克隆抗体的基本结构包括两条相同的重链(Heavy Chain, H)和两条相同的轻链(Light Chain, L),通过二硫键连接形成Y形结构。Y形的两个“臂”由可变区(Variable Region, V)构成,其中包含互补决定区(Complementarity-Determining Regions, CDRs),负责识别和结合抗原。Y形的“柄”部分由恒定区(Constant Region, C)构成,主要介导抗体与免疫细胞的相互作用。根据恒定区的不同,抗体可分为IgG、IgM、IgA、IgD和IgE五类,其中IgG类抗体因其较长的血清半衰期和良好的组织穿透能力,成为ADC开发中最常用的抗体类型。

抗体的人源化历程

早期的治疗性抗体多为鼠源抗体(murine antibodies),即完全由小鼠B细胞产生的抗体。尽管鼠源抗体具有良好的抗原结合能力,但在人体内使用时存在明显的局限性:高免疫原性(易引发人抗鼠抗体反应,HAMA)、在人体内的疗效较差以及血清半衰期短。为克服这些问题,科学家们开发了嵌合抗体(chimeric antibodies),将鼠源抗体的可变区与人源抗体的恒定区融合,从而降低了免疫原性。然而,嵌合抗体仍保留了部分鼠源序列,仍可能引发免疫反应。

为实现更彻底的人源化,研究人员进一步开发了人源化抗体(humanized antibodies),仅保留鼠源抗体中决定抗原结合特异性的CDR环,其余部分均替换为人源序列。这极大地降低了免疫原性,同时保留了高亲和力的抗原结合能力。最终,随着基因工程技术的发展,特别是噬菌体展示技术(phage display technology)和人源可变区基因在大肠杆菌中的表达技术的成熟,全人源抗体(fully human antibodies)得以实现。全人源抗体的所有组成部分均来源于人类,具有最低的免疫原性、较长的血清半衰期和良好的疗效,已成为当前ADC开发的首选。

目前,大多数已获批或处于开发阶段的ADC使用人源化或全人源单克隆抗体。例如,用于治疗霍奇金淋巴瘤的brentuximab vedotin(Adcetris®)是少数使用嵌合抗体的ADC之一。选择用于ADC的单克隆抗体时,最关键的属性是高靶抗原特异性。如果ADC与非靶抗原发生非特异性结合,可能导致不可预测的脱靶效应,引发严重毒性。此外,理想的ADC抗体还应具备高亲和力、良好的药代动力学特性(如长半衰期)以及较低的免疫原性。

Types of monoclonal antibody. Key: human-derived mAb regions shown in blue; mouse-derived (or for humanised mAbs, synthetic/animal-derived) mAb regions shown in orange.

传统与AI驱动的抗体设计
早期的ADC开发主要依赖于经验筛选和基于结构的设计方法。X射线晶体学和小角X射线散射(SAXS)等技术提供了抗体和抗原的原子级结构信息,为计算建模提供了模板。这些结构信息有助于初步评估连接位点和抗原结合兼容性。然而,这些方法存在局限性:结构数据往往不完整,且在蛋白质数据库(PDB)和电子显微镜数据库(EMDB)中,通常只包含抗体片段,如抗原结合片段(Fabs)、单链可变片段(scFvs)或孤立的VH/VL结构域,缺乏完整的抗体-抗原复合物结构。

近年来,人工智能(AI)和机器学习(ML)技术的兴起为抗体设计带来了革命性的变革。深度学习模型,如AlphaFold3,能够准确预测蛋白质结构及其与配体的相互作用,包括糖基化和载荷结合,为完整ADC的原子级建模提供了可能。这些先进的计算方法能够同时预测抗体主链和侧链构象,显著提高了结构预测的精度和效率。此外,生成式算法被用于抗体序列的多样化和亲和力优化,例如,IgLM模型能够生成全长抗体序列和填充CDR H3环库,而EvoDesign则能进行基于表位引导的序列设计,优化结合位点以适应连接兼容性。

表1列出了部分用于抗体和ADC设计的计算工具。例如,OptCDR(2010年)用于CDR设计,MEAN(2023年)用于抗体设计,AbSciBio(2024年)用于从头抗体设计。这些工具的不断发展,使得抗体设计从传统的“试错法”逐步转向基于AI的理性设计,大大加速了抗体发现和优化的进程。

连接子:ADC的“智能开关”
连接子是ADC中连接单克隆抗体和细胞毒性载荷的化学桥梁,其设计对ADC的稳定性、药代动力学和治疗窗口至关重要。一个理想的连接子需要在血液循环中保持高度稳定,防止载荷在到达靶标前过早释放(导致脱靶毒性),同时在进入肿瘤细胞后能够高效、特异性地释放活性药物。根据其释放机制,连接子主要分为两大类:可裂解连接子(cleavable linkers)和不可裂解连接子(non-cleavable linkers)。

可裂解连接子
可裂解连接子依赖于肿瘤微环境或细胞内特定的化学或酶学条件来触发载荷的释放。这类连接子通常在血液中相对稳定,但在肿瘤部位或细胞内被激活。常见的可裂解连接子包括:
  • 腙键连接子(Hydrazone linkers)
    :这类连接子对酸性环境敏感,在肿瘤微环境的低pH条件下发生水解,从而释放药物。例如,Mylotarg®中的连接子就是一种腙键连接子。然而,腙键在血浆中也可能发生一定程度的水解,导致稳定性不足和脱靶毒性,因此其应用受到一定限制。
  • 二硫键连接子(Disulfide linkers)
    :这类连接子依赖于细胞内高水平的还原性谷胱甘肽(GSH)来断裂二硫键,释放药物。肿瘤细胞内的GSH浓度通常远高于正常细胞和血液,为二硫键的特异性裂解提供了条件。然而,血浆中也存在还原性环境,可能导致连接子在循环中不稳定。
  • 肽类连接子(Peptide-based linkers)
    :这是目前应用最广泛的可裂解连接子类型。它们通常由特定的二肽序列构成,如缬氨酸-瓜氨酸(Val-Cit,见于Adcetris®)、缬氨酸-丙氨酸(Val-Ala,见于loncastuximab tesirine)和丙氨酸-丙氨酸(Ala-Ala,见于IMGN632)。这些二肽序列是溶酶体蛋白酶(如组织蛋白酶B)的底物,该酶在多种癌细胞中过表达。连接子通常还包含一个对氨基苄基氧羰基(PABC)间隔基,它能将二肽与载荷分隔开,使蛋白酶更容易接近裂解位点。与腙键和二硫键相比,肽类连接子具有更好的血浆稳定性、更高的特异性和更低的pH敏感性,因此成为当前ADC设计的主流选择。

不可裂解连接子
与可裂解连接子不同,不可裂解连接子在细胞内不会发生化学断裂。载荷的释放依赖于抗体部分在溶酶体内的完全降解。当ADC通过抗原介导的内吞作用进入肿瘤细胞后,整个复合物被转运至溶酶体。在溶酶体的酸性环境和多种蛋白酶作用下,抗体部分被彻底降解,最终释放出与连接子和部分氨基酸残基相连的活性代谢物(如Lys-MCC-DM1 for Kadcyla®)。

不可裂解连接子的主要优势在于其极高的血浆稳定性,这赋予了ADC更长的血浆半衰期,减少了脱靶毒性,并通常能提供更宽的治疗窗口。常见的不可裂解连接子基于马来酰亚胺结构,如马来酰亚胺己酰基(MC,见于depatuxizumab mafodotin)和4-马来酰亚胺甲基环己烷-1-羧酸酯(MCC,见于Kadcyla®)。值得注意的是,MC连接子具有多功能性,既可作为不可裂解连接子的主体(如depatuxizumab mafodotin),也可作为间隔基连接在抗体和可裂解二肽之间(如Adcetris®)。

选择可裂解还是不可裂解连接子取决于多种因素,包括靶抗原的内吞效率、肿瘤微环境的特性以及载荷的性质。例如,对于内吞效率高且溶酶体蛋白酶丰富的肿瘤,肽类可裂解连接子可能更有效;而对于需要极高稳定性的应用,不可裂解连接子则是更优选择。近年来,研究者也在探索新型连接子,如可被特定酶(如β-葡萄糖醛酸酶)或外部刺激(如光、超声波)触发的连接子,以进一步提高ADC的靶向性和可控性。

细胞毒性载荷:ADC的“致命弹头”
细胞毒性载荷是ADC中发挥杀伤肿瘤细胞作用的核心成分,通常为高活性的小分子药物,其细胞毒性比传统化疗药物强100至1000倍。由于载荷通过抗体靶向递送,因此可以使用极高毒性的药物,而不会对全身造成不可接受的毒性。目前,用于ADC的载荷主要分为两大类:微管抑制剂和DNA损伤剂。此外,新型载荷类别也在不断涌现。


微管抑制剂
微管是细胞骨架的重要组成部分,在细胞分裂(有丝分裂)过程中扮演关键角色。微管抑制剂通过干扰微管的动态平衡,阻止细胞进入有丝分裂后期,导致细胞周期停滞在中期,最终诱导细胞凋亡。
  • 美登素类(Maytansinoids)
    :这类化合物是从非洲灌木植物中分离得到的强效微管抑制剂。其代表是DM1和DM4,被用于Kadcyla®(ado-trastuzumab emtansine)中。DM1通过不可裂解的MCC连接子与曲妥珠单抗连接。Kadcyla®的成功上市证明了美登素类作为ADC载荷的巨大潜力。
  • 奥利斯他汀类(Auristatins)
    :这类化合物最初从海兔(Dolabella auricularia)中分离得到的海兔毒素(dolastatins)衍生而来。其最常用的衍生物是单甲基奥利斯他汀E(MMAE)和单甲基奥利斯他汀F(MMAF)。MMAE和MMAF均能结合微管的长春花碱结合域,抑制微管聚合。MMAE因其良好的细胞膜通透性,被广泛用于多种ADC,如Adcetris®(brentuximab vedotin)、Padcev®(enfortumab vedotin)和Polivy®(polatuzumab vedotin)。MMAF由于其C端羧基的存在,细胞膜通透性较差,但水溶性更好,聚集倾向更低,系统性毒性也相对较低。
DNA损伤剂
DNA损伤剂通过直接破坏DNA结构或干扰DNA复制和修复过程,导致细胞死亡。这类载荷尤其适用于杀伤分裂和非分裂(静止)的肿瘤细胞。
  • 卡奇霉素类(Calicheamicins)
    :这是一类从放线菌Micromonospora echinospora中分离得到的强效烯二炔类抗生素。其代表是卡奇霉素γ1的衍生物,被用于Mylotarg®和Besponsa®(inotuzumab ozogamicin)中。卡奇霉素通过与DNA的小沟结合,并引发双链断裂,造成不可逆的DNA损伤。其作用机制独特且高效,但同时也带来了较高的毒性风险,因此对连接子的稳定性和靶向性要求极高。
  • 吡咯并苯并二氮䓬类(Pyrrolobenzodiazepines, PBDs)
    :这是一类源自放线菌的天然产物,能与DNA双螺旋的小沟共价结合,形成交联,阻止DNA复制和转录。PBD二聚体(如SG3199)具有极高的细胞毒性,被用于多种新型ADC的开发,如loncastuximab tesirine(靶向CD19)。
  • 杜卡霉素类(Duocarmycins)
    :这类化合物能烷基化DNA,导致单链或双链断裂。其高活性使其成为有吸引力的ADC载荷候选者。

新型载荷类别
除了传统的微管和DNA靶向剂,研究人员正在积极探索其他机制的新型载荷,以克服耐药性和扩大治疗范围。
  • α-鹅膏蕈碱(α-Amanitin)
    :这是一种从毒蘑菇(Amanita spp.)中提取的双环八肽,属于鹅膏毒素家族。它通过结合并抑制RNA聚合酶II,阻断转录和蛋白质合成。α-鹅膏蕈碱具有高活性、血浆稳定性好、亲水性强等优点,最重要的是,它能有效杀伤分裂和静止的肿瘤细胞,这对于治疗那些增殖缓慢或处于休眠状态的肿瘤细胞(如肿瘤干细胞)具有重要意义。目前,Heidelberg Pharma公司的HDP-101(靶向BCMA)是进展最快的以α-鹅膏蕈碱为载荷的ADC,已进入临床前研究阶段。
  • 拓扑异构酶抑制剂
    :这类药物通过抑制拓扑异构酶I或II的活性,干扰DNA的复制和修复。Exatecan衍生物等已被探索作为ADC载荷。

选择合适的载荷是ADC设计的关键。理想的载荷应具备极高的细胞毒性(IC50在pM级别)、良好的化学稳定性、合适的连接位点(便于与连接子偶联)、足够的水溶性以及在释放后保持活性。此外,载荷的机制(如是否能杀伤静止细胞)也直接影响ADC的治疗效果和适应症范围。

AI/ML在ADC设计中的应用与挑战
尽管ADC领域取得了显著进展,但其开发过程仍然充满挑战。传统的经验性筛选方法耗时、成本高昂,且受限于不完整的结构信息和非系统性的连接子-载荷选择。人工智能(AI)和机器学习(ML)技术的整合为解决这些瓶颈提供了强大的工具,推动了“AI驱动的ADC设计”(AI-driven ADC Design)的兴起。

AI/ML的应用领域
AI/ML在ADC设计中的应用贯穿于整个研发流程:

  • 抗体结构预测与连接位点识别
    :深度学习模型,如AlphaFold3,能够高精度预测抗体及其与配体(包括糖基和载荷)的复合物结构。这为识别最优的连接位点(conjugation site)提供了原子级的洞察,避免了可能影响抗原结合或导致不稳定的位点。

  • 药代动力学与毒性预测
    :ML框架被用于建模ADC的药代动力学(PK)特性和毒性谱。例如,Angiolini等人(2025)开发了机器学习模型来预测抗体-药物偶联物(ADCs)合成中的药物-抗体比(DAR),这对于控制产品质量和疗效至关重要。
  • 抗体序列多样化与亲和力优化
    :生成式算法,如IgLM和EvoDesign,能够生成多样化的抗体序列库,并通过优化CDR序列来提高抗体的亲和力和降低免疫原性,加速抗体工程化进程。
  • 整合计算与高通量实验
    :AI模型的预测结果可以与高通量实验系统(如自动化筛选平台)相结合,形成“预测-验证-迭代”的闭环设计框架,显著提高研发效率。

面临的挑战
尽管AI/ML在ADC设计中展现出巨大潜力,但仍面临诸多挑战:
  • 数据稀缺性
    :高质量、公开可用的ADC数据严重不足。许多实验信息,如连接化学、DAR、连接子稳定性、药代动力学和毒性数据,要么是专有的,要么报告不一致,这限制了可推广模型的开发。对于罕见的连接化学,数据稀缺问题尤为突出。
  • 模型的可解释性
    :许多AI模型,特别是深度神经网络,被视为“黑箱”,其决策过程难以解释。这在安全至关重要的药物开发领域是一个重大障碍,影响了监管机构的接受度。
  • 实验验证负担
    :AI模型的预测需要大量的实验验证,这本身就是一个耗时耗力的过程。如何高效地设计验证实验,是实现AI与实验无缝整合的关键。
  • 多模态交互的复杂性
    :ADC是一个由抗体、连接子和载荷三部分组成的复杂系统,各部分之间的相互作用是非线性和情境依赖的。当前的模型往往难以准确捕捉这些多模态交互,尤其是在缺乏完整ADC三维结构信息的情况下。
  • 监管障碍
    :将AI/ML模型应用于药物开发,需要建立新的监管标准和验证流程,以确保模型的可靠性、可重复性和安全性。

未来的发展方向将依赖于集成的、多尺度的建模方法,将蛋白质结构预测、系统药理学和真实世界临床及组学数据相结合。AlphaFold3等技术的进步为完整ADC的结构建模铺平了道路。结合系统级数据,这些结构洞察有望实现更可预测的治疗设计。此外,强化学习(RL)和闭环设计框架也被认为是支持迭代ADC开发的关键技术。

结论与展望
抗体-药物偶联物(ADCs)作为“魔法子弹”理念的现代实现,已成为癌症靶向治疗的重要支柱。通过巧妙地结合单克隆抗体的靶向性、连接子的智能调控和细胞毒性载荷的高效杀伤,ADCs实现了对肿瘤细胞的精准打击,显著改善了多种癌症患者的预后。从首个ADC药物Mylotarg®的获批,到如今超过360项临床试验的蓬勃开展,ADC领域经历了从概念验证到快速发展的辉煌历程。

回顾其发展,我们可以看到,技术的进步是推动ADC演进的核心动力。从鼠源抗体到全人源抗体的转变,极大地降低了免疫原性;从简单的腙键到高度特异的肽类连接子,显著提高了药物的稳定性和治疗窗口;从美登素、奥利斯他汀到卡奇霉素、PBDs乃至α-鹅膏蕈碱,载荷的多样性不断拓展,杀伤机制日益丰富。这些进步共同造就了当今疗效更佳、安全性更高的新一代ADC药物。

展望未来,ADC的发展将进入一个更加智能化和系统化的时代。人工智能(AI)和机器学习(ML)技术的深度整合,正在重塑ADC的研发范式。从传统的“试错法”转向基于AI的理性设计,使得抗体工程、连接子优化和载荷筛选变得更加高效和精准。AlphaFold3等先进工具为完整ADC的原子级建模提供了可能,而生成式算法则能加速抗体序列的多样化和亲和力成熟。尽管数据稀缺、模型可解释性和监管接受度等挑战依然存在,但集成的多尺度建模、强化学习和闭环设计框架有望克服这些障碍。

此外,ADC的应用范围也在不断扩展。除了传统的实体瘤和血液瘤,ADC在自身免疫性疾病、抗感染治疗等领域的潜力也正在被探索。双特异性ADC、条件激活ADC等新型设计将进一步提高靶向特异性和安全性。可以预见,随着基础科学的深入和技术的持续创新,ADC将继续在精准医疗的浪潮中扮演关键角色,为更多患者带来新的希望。

相关文章 更多 >