文章

Nature分享:BindCraft开源工具破解蛋白质结合剂设计难题

2025-08-29     来源:Drug AI     点击次数:52

文章来源公众号:Drug AI        作者:Drug AI

未来,或许只需输入靶标结构,就能在几天内获得具备临床潜力的功能分子

在生物医学与生物技术领域,蛋白质-蛋白质相互作用(PPIs)是调控生命活动的核心机制,而设计能特异性靶向并调控PPIs的蛋白质结合剂,一直是开发治疗药物、诊断工具与分子生物学试剂的关键方向。传统方法如免疫接种、抗体库筛选或定向进化,不仅耗时费力,还难以精准控制结合位点,且实验成功率常低于0.1%。即便近年来兴起的计算设计方法,如基于Rosetta的物理模拟或结合RFdiffusion与ProteinMPNN的深度学习策略,仍存在 backbone生成与功能界面设计脱节、依赖高通量筛选等局限。

近期,EPFL×MIT团队在《Nature》发表的题为“One-shot design of functional protein binders with BindCraft”的研究,提出了一款名为BindCraft的开源自动化设计流程,彻底改变了这一局面。该工具以AlphaFold2(AF2)为核心驱动,无需高通量筛选或实验优化,就能从头设计出纳米摩尔级亲和力的蛋白质结合剂,实验成功率高达10%~100%,即便在未知结合位点的情况下仍能高效工作。

一、BindCraft:为何能突破传统设计的“死穴”?

传统计算设计方法的核心痛点,在于难以兼顾“结构准确性”与“功能有效性”——要么依赖固定靶标结构进行预定义支架对接,导致界面兼容性差;要么在backbone生成后难以精准优化功能界面。BindCraft的创新之处,在于直接将AF2的结构预测能力融入设计全过程,通过反向传播(backpropagation)实现结合剂的结构、序列与界面协同优化,而非仅将AF2作为后续筛选工具。

其设计流程可概括为三大核心步骤:首先,基于AF2多聚体模型(AF2 multimer)初始化结合剂设计。由于AF2 multimer经蛋白质复合物数据训练,能更精准模拟PPIs,相比单体模型可生成更大(平均大20%)、环结构占比更高且置信度更强的结合界面。设计初始阶段,BindCraft会以随机序列启动结合剂“幻觉生成”(hallucination),通过AF2网络计算设计损失(design loss),该损失函数整合了结合剂置信度(pLDDT)、界面置信度(i_pTM)、预测对齐误差(pAE)、残基接触等9项关键指标,确保设计既符合结构合理性,又满足功能需求。

其次,通过多阶段序列优化提升结合剂的可溶性与稳定性。AF2幻觉生成的序列虽能保证界面结合活性,但常存在表达量低的问题。为此,BindCraft引入MPNNsol(一种消息传递神经网络),在保持结合界面完整的前提下,对结合剂的核心与表面序列进行优化——这一步既能保留关键结合位点,又能改善蛋白质的可溶性与表达效率,解决了此前AF2幻觉蛋白“难表达”的共性问题。

最后,通过严格的多维度筛选确保设计质量。优化后的序列会经AF2单体模型重新预测(避免多聚体模型对PPIs的预测偏倚),再结合Rosetta的物理基于评分(如界面形状互补性、氢键数量等),最终筛选出pLDDT>0.8、i_pTM>0.5、界面氢键>3等满足严格标准的设计。整个流程完全自动化,用户仅需提供靶标PDB结构与基本设计参数(如结合剂长度范围),无需专业计算背景即可操作,真正实现了蛋白质结合剂设计的“民主化”。

值得注意的是,BindCraft还解决了传统设计的另一大局限——靶标结构的“刚性依赖”。此前如RFdiffusion等方法需固定靶标backbone,而BindCraft在每轮设计迭代中都会重新预测结合剂-靶标复合物结构,允许靶标与结合剂的侧链和backbone存在一定灵活性(靶标backbone的Cα RMSD可在0.5~5.5 Å范围内调整),最终形成的结合界面能更精准地“贴合”靶标结合位点,这也是其能在未知结合位点场景下工作的关键。

图1. 基于 BindCraft 的从头结合剂设计流程与靶标概况。a 部分为 BindCraft 结合剂设计流程的示意图,展示了从靶标蛋白质结构输入到最终筛选获得优化设计的完整步骤 —— 首先利用 AF2 多聚体模型生成结合剂的骨架与序列,接着在保持界面完整的前提下,通过 MPNN 对结合剂的表面和核心序列进行优化,最后基于 AF2 单体模型预测结果筛选出高质量设计;b 部分为结合剂设计的蛋白质靶标概览,标注了各类靶标的结构特征(绿色为设计时使用的区域,灰色为排除区域)、实验验证的成功结合剂数量(蓝色框内,分子结合通过 SPR 检测)及最高亲和力结合剂的解离常数(Kd,黄色框为实测值,橙色框为因拟合效果差的估算值),涵盖细胞表面受体(如 PD-L1、PD-1)、常见过敏原(如 BetV1、DerF21)、多结构域核酸酶(如 SpCas9)等 12 类挑战性靶标,其中 PD-1 结合剂以双价 Fc 融合形式测试,部分靶标最低 Kd 可达 < 1 nM,直观体现了 BindCraft 在不同类型靶标上的设计效率与亲和力水平。

二、12类挑战性靶标验证:从细胞表面受体到核酸结合蛋白

一款蛋白质设计工具的价值,最终需通过实验验证其普适性与功能性。BindCraft团队选择了12类具有重要生物学与治疗意义的靶标进行测试,涵盖细胞表面受体、常见过敏原、从头设计蛋白及多结构域核酸酶(如CRISPR-Cas9),每类靶标的设计结果都令人惊喜。

1. 细胞表面受体:精准靶向免疫检查点与未知位点

细胞表面受体是免疫治疗的核心靶标,但传统抗体设计常受限于已知结合位点。BindCraft针对PD-1(免疫检查点受体)设计的53个结合剂中,13个表现出结合活性,最优结合剂以双价Fc融合形式存在时,表观解离常数(Kd*)<1 nM,且与临床药物 pembrolizumab(帕博利珠单抗)竞争相同结合位点——这意味着其有望成为PD-1抑制剂的替代候选分子,且分子量更小(60~240个氨基酸),可能具备更好的组织穿透性。

更值得关注的是,BindCraft对“无已知结合位点”靶标的设计能力。以CD45为例,其胞外域含4个免疫球蛋白样结构域且高度糖基化,传统方法难以定位结合位点。BindCraft设计的16个结合剂中,4个通过SPR验证,最优结合剂(binder1)亲和力达14.7 nM,且精准靶向d3与d4结构域的连接区域——这一结果证明,BindCraft无需依赖已知结合位点信息,仅通过靶标结构即可“自主”发现功能性结合区域,为难成药受体的靶向提供了新策略。

图2. 针对细胞表面受体的结合剂设计与功能验证。a 为 binder2 与 PD-1 复合物的设计模型,b 为 BLI 传感器图显示 binder2(双价 Fc 融合形式)与 PD-1 的结合动力学,其 Kd*≤1 nM;c 为 binder4 与 PD-L1 的设计模型,d 为 SPR 测定的二者结合亲和力(Kd*=615 nM);e 为 binder5 与 IFNAR2 的设计模型,f 为 SPR 测定的二者结合亲和力(Kd=260 nM);g 为 binder1 与 CD45 的设计模型,h 为 SPR 测定的二者结合亲和力(Kd=14.7 nM);i 为基于 CpE 的细胞毒性及 CLDN1 结合剂抑制机制的示意图;j 为 SPR 单循环动力学分析显示 CLDN1 结合剂 12 与可溶性 CLDN1 类似物的结合;k 为细胞实验表明 CLDN1 结合剂 9、12 能以浓度依赖方式抑制 CpE 诱导的细胞毒性,效果与已知 CpE 抑制剂相当;l 为 MST 测定显示结合剂 12 可阻断 CpE 与 CLDN1 WT 的结合,验证了结合剂与 CpE 竞争相同结合位点的机制,全面证明了 BindCraft 设计的细胞表面受体结合剂在结构准确性、结合亲和力及功能调控上的有效性。

2. 过敏原:从结构设计到临床样本验证的“抗过敏”潜力

过敏原是一类极具挑战性的设计靶标——其表面多带高电荷,且传统认为疏水性结合位点更易设计,而过敏原的亲水性表面常导致设计失败。BindCraft针对尘螨过敏原Der f7、Der f21及桦树主要过敏原Bet v1(引发95%桦树相关过敏)的设计,打破了这一认知。

针对Bet v1,BindCraft设计的7个结合剂中2个有效,最优结合剂(binder2)亲和力达120 nM,且能与临床候选抗体混合物(REGN5713/5714/5715)竞争相同表位。更关键的是,在患者血清样本中,该结合剂能阻断Bet v1与IgE的结合,最高阻断率达50%——这一结果与单克隆抗体的阻断效果相当,且结合剂稳定性更高,为过敏性疾病的“精准中和”提供了新方案。此外,针对Der f7的结合剂(binder2)还通过晶体结构验证,其backbone与设计模型的RMSD仅1.7 Å,证明了BindCraft设计的结构准确性。

图3. 阻断常见过敏原表位的结合剂设计。a 左侧为针对尘螨过敏原 Der f7 的 binder2 设计模型,右侧为 SPR 测定的二者结合亲和力(Kd=12.8 nM);b 为 Der f7-binder2 复合物的晶体结构(彩色)与设计模型(灰色)叠加图,验证了设计的结构准确性;c 左侧为针对尘螨过敏原 Der f21 的 binder10 设计模型,右侧为 SPR 测定的二者结合亲和力(Kd*=793 nM);d 为 Der f21-binder10 复合物的晶体结构(彩色)与设计模型(灰色)叠加图,因界面酪氨酸的旋转异构体构象差异,backbone 的 RMSD 为 3.1 Å;e 左侧为针对桦树过敏原 Bet v1 的 binder2 设计模型,右侧为 SPR 测定的二者结合亲和力(Kd=120 nM);f 为 SEC-MALS 分析显示 Bet v1(蓝色,预期分子量 18.5 kDa)与 binder2(橙色,预期分子量 29.3 kDa)形成 1:1 复合物(实测分子量 27.8 kDa);g 为 Bet v1 与商业抗 Bet v1 REGN 抗体混合物结合的冷冻电镜结构(PDB 7MXL);h 为竞争实验证实 binder2 与 REGN5713 抗体靶向 Bet v1 的重叠表位;i 为阻断 ELISA 实验显示,binder2 能像 REGN 抗体混合物一样,阻止 Bet v1 与桦树过敏患者血清中 IgE 的结合,部分患者中阻断率达 50%,体现了其抗过敏治疗潜力。

3. 多结构域核酸酶:攻克“不可成药”的核酸结合界面

核酸结合蛋白(如CRISPR-Cas9、Argonaute)的界面因大尺寸、高电荷、凸面结构,一直被认为是“不可成药”靶点——小分子难以结合,传统抗体又难以穿透核酸结合通道。BindCraft针对这类靶标的设计,首次证明了蛋白质结合剂可有效调控核酸酶活性。

在SpCas9(CRISPR基因编辑核心工具)的设计中,BindCraft靶向其REC1结构域(向导RNA结合口袋),6个测试结合剂全部能结合全长apo SpCas9,最优结合剂(binder3/10)亲和力达300 nM级。功能实验显示,这些结合剂能显著降低HEK293T细胞中的Cas9基因编辑效率,且抑制效果优于天然抗CRISPR蛋白AcrIIC2——这为基因编辑的“精准调控”提供了新工具,可有效降低脱靶效应。

更令人振奋的是对Argonaute核酸酶(CbAgo)的设计。CbAgo作为细菌免疫系统的关键分子,通过小核酸向导切割外源DNA,但目前尚无天然抑制剂报道。BindCraft针对其N-PIWI通道或PAZ结构域设计的12个结合剂中,2个能强效抑制CbAgo的DNA切割活性:加入2 μM binder2后,CbAgo的催化常数(kcat)从0.004 s⁻¹降至5×10⁻⁵ s⁻¹(降低80倍),且该结合剂能与CbAgo形成稳定复合物,通过竞争向导DNA(gDNA)结合位点发挥作用。这一结果不仅证明BindCraft可设计核酸结合界面的结合剂,更为开发新型核酸酶抑制剂提供了范式。

图4. 针对核酸引导多结构域核酸酶的从头结合剂设计。a 为 SpCas9 REC1 结构域与向导 RNA 结合的局部放大图(PDB 4ZT0),标注了设计结合剂的结合口袋;b 为 binder3 与 apo 形式 SpCas9 结合的冷冻电镜结构,REC1 结构域为绿色,其余部分为灰色,叠加了灰色的冷冻电镜密度;c 为 binder10 与 apo 形式 SpCas9 结合的冷冻电镜结构,标注方式同 b;d 为 HEK293T 细胞中 SpCas9 基因编辑效率实验,显示设计的结合剂(绿色柱)能显著降低编辑效率,部分效果优于天然抗 CRISPR 蛋白(蓝色柱);e 为结合 gDNA 和 tDNA 的 Clostridium butyricum Argonaute(CbAgo)结构示意图(PDB 6QZK),标注了设计靶向的 PAZ 结构域及 N+PIWI 结构域;f 为 CbAgo 介导的 tDNA 切割实验,显示设计的结合剂(绿色柱)能强效抑制切割活性;g 为时间依赖性的 CbAgo-gDNA 介导靶 DNA 切割曲线,显示加入 binder2(粉色线)或 binder3(紫色线)后,切割效率显著低于无结合剂组(灰色线),证实了结合剂对核酸酶活性的抑制作用。

三、从“设计”到“应用”:BindCraft的转化潜力

优秀的技术不仅要解决科学问题,更要具备实际应用价值。BindCraft团队在论文中展示了其在基因治疗、毒素中和等领域的转化潜力,其中最具代表性的是腺相关病毒(AAV)的靶向重定向

AAV是基因治疗的常用载体,但天然AAV靶向性差,常需高剂量给药,导致脱靶效应与免疫原性风险。传统AAV重定向方法依赖肽段插入或抗体片段融合,需大量筛选且难以控制结合位点。BindCraft的解决方案是:设计针对特定细胞表面受体(如HER2、PD-L1)的迷你蛋白结合剂,将其插入AAV衣壳的VR-V区域(经突变研究验证的最优插入位点),同时通过突变敲除AAV对肝素与唾液酸的天然结合能力,实现“脱靶-重定向”双重调控。

实验结果显示,针对HER2设计的结合剂(binder1)与PD-L1设计的结合剂(binder202),能使AAV特异性靶向表达HER2或PD-L1的HEK293细胞, transduction效率最高提升61倍,且当加入靶向PD-L1的抗体后,transduction被显著阻断——证明结合剂确实介导了AAV与靶标受体的特异性结合。这一成果为基因治疗的“精准递送”提供了新策略,可实现对疾病相关细胞的定向基因导入,降低系统毒性。

图5. 通过 AAV 工程实现靶向基因递送。该图呈现了利用 BindCraft 设计的结合剂重定向 AAV 载体以实现靶向基因递送的成果:a 为 AAV-cmv-GFP 重定向的示意图,展示了通过插入细胞类型受体特异性迷你蛋白结合剂,替代 AAV 对细胞表面聚糖的天然结合,实现靶向递送;b 为重定向 AAV 颗粒的嵌合组装示意图,包含天然亚基与插入结合剂的工程亚基,形成从头设计的蛋白质 - 蛋白质相互作用;c 为流式细胞术检测不同 AAV 变体对 HER2 或 PD-L1 过表达 HEK293 细胞的转导效率,标注了信号噪声比(× 倍),显示靶向 HER2 和 PD-L1 的 AAV 变体转导特异性显著提升,而野生型(WT)和敲除型(KO)AAV 无特异性;d 为针对 HER2 的 binder1 设计模型;e 为针对 PD-L1 的 binder202 设计模型;f 为热图展示不同 AAV 变体在 HER2 或 PD-L1 过表达细胞上的转导率,验证了靶向变体的特异性;g 为 PD-L1 靶向 AAV 的转导实验,直方图显示加入抗 PD-L1 抗体后,转导效率显著降低,证实设计的结合剂介导了 AAV 与靶标受体的特异性结合,为精准基因治疗提供了新策略。

BindCraft 设计的计算机模拟分析。该图通过多维度数据对 BindCraft 的设计过程与结果进行计算机模拟验证:a 为不同设计靶标在 AF2 结合剂幻觉生成后,靶标结构相对于输入靶标结构的 Cα RMSD 值分布图,体现了靶标结构的灵活性范围;b 为螺旋度损失对 PD-L1 结合剂二级结构含量的影响,负权重值(抑制 α- 螺旋形成)可产生纯 β- 折叠结合剂;c 为不同靶标和结合剂长度下,生成 100 个通过计算筛选的结合剂所需的 GPU 小时数,标注了需采样的设计数量,对比了 BindCraft 与 RFdiffusion 的计算效率;d 为 BindCraft 与 RFdiffusion 在 PD-L1、IFNAR2、DerF7 和 BBF-14 四个靶标上,结合剂界面的氨基酸类型分布对比图;e 为设计的结合剂折叠结构(绿色)及结合剂 - 靶标界面(粉色)与 PDB 中最相似结构的最大 TM 分数和序列同一性对比箱线图,箱线图中心线为中位数,箱体为 25%~75% 分位数,须为最小值和最大值,异常值为超出 1.5 倍四分位距的数据点,证实设计结合剂的结构与界面新颖性。

四、展望与局限:蛋白质设计迈入“按需定制”时代

BindCraft的出现,标志着计算蛋白质设计从“高通量筛选依赖”向“一次设计即获功能分子”迈进。其平均46.3%的实验成功率,远超当前主流方法(如RFdiffusion约10%~20%),且无需依赖高通量筛选平台,使普通实验室也能开展高质量蛋白质结合剂设计。但作为研究者,我们也需客观看待其局限:一是GPU计算成本较高,反向传播过程对硬件要求较高;二是AF2单体模型筛选可能排除部分高亲和力结合剂,且AF2对单点突变不敏感,需结合Rosetta等工具进一步验证;三是结合剂的免疫原性与体内递送问题仍需解决——尽管其分子量小于抗体,但合成蛋白的免疫原性仍需在动物模型中评估。

不过,这些局限并非不可克服。随着AlphaFold3等新一代模型的出现,结合剂的设计精度有望进一步提升;而递送技术(如纳米颗粒、细胞穿透肽)的发展,也将助力结合剂的体内应用。更重要的是,BindCraft已开源,这意味着研究者可在此基础上进行二次开发,推动技术快速迭代。

回顾蛋白质设计领域的发展,从早期Rosetta的“脚手架设计”到如今BindCraft的“协同优化”,我们见证了计算方法从“辅助筛选”到“主导设计”的转变。BindCraft的成果不仅为治疗(如抗过敏、基因编辑调控)、诊断(如特异性探针)与生物技术(如AAV靶向递送)提供了新工具,更让我们看到了“按需定制蛋白质结合剂”的可能性——未来,或许只需输入靶标结构,就能在几天内获得具备临床潜力的功能分子。

建议相关领域的研究者重点关注这一工具,无论是开发新型治疗药物,还是探索蛋白质相互作用的基本机制,BindCraft都将成为极具价值的研究助手。也期待未来能看到更多基于BindCraft的转化研究,让计算蛋白质设计真正从实验室走向临床。​

相关文章 更多 >