文章

Nat Biotechnol文章分享:利用AI人工智能重新定义可成药靶点

2025-08-28     来源:智药邦     点击次数:51

文章来源公众号:智药邦             作者:智药邦

2025年8月19日,由Regina Barzilay(麻省理工学院)与Olivier Elemento(威尔康奈尔医学院英格兰精准医学研究所)共同牵头,联合来自哥伦比亚大学、Dewpoint Therapeutics、Amgen、美国国家癌症研究所(NCI)、斯坦福大学等机构的多位顶尖学者,在国际顶级期刊Nature Biotechnology上发表了题为Redefining druggable targets with artificial intelligence的评论文章。



该文凝聚了美国“抗癌登月计划”(Cancer Moonshot)研讨会的核心洞见,系统性地阐述了人工智能(Artificial Intelligence, AI)如何颠覆传统药物研发范式,为攻克癌症治疗中长期存在的“难药性靶点”(undruggable targets)提供革命性的新思路和框架。

不可成药靶点的概念长期以来限制了癌症治疗,但近期的成功——例如KRAS(G12C)抑制剂的开发——证明了这一障碍并非不可改变。人工智能与现有治疗模式——包括蛋白降解剂、变构调节剂和凝聚物干扰剂——的融合呈现了一个分水岭时刻。AI的作用不仅限于加速现有研发管线;它通过预测结构与动力学、实现系统水平分析以及指导新型治疗药物的设计,为解决棘手靶点提供了新方法。然而,数据质量、模型验证和临床转化方面仍然存在重大挑战。

图1 栓系化合物选择性结合致癌K-Ras(G12C)

AI在不可成药靶点空间面临的挑战与一般药物发现不同。尽管药物发现中的许多AI都能访问大量的化学和生物学数据集,但不可成药领域的特点是数据稀缺、未发表阴性结果比例很高以及未知的生物作用机制(如调节生物分子凝聚物)。这需要从内插大型数据集转变为从稀疏的复杂信息中推断预测,这需要根本上不同的AI策略和验证框架。

对新型分类法和定制AI工具的需求
“不可成药”标签是一个笼统的概念,它将不同的分子学挑战混为一谈,从而阻碍了进展。向前迈出的关键一步是开发一种功能性分类法,根据其特有的不可成药机制对靶点进行分类。这样一个系统将允许有针对性地应用AI工具。

例如,许多转录因子被认为是不可成药的,因为它们缺乏传统药物靶点的明确酶活性位点。因此,治疗策略必须靶向其功能,而这通常是由其组装成大型蛋白质复合物来介导的。像AlphaFold和OpenFold这样的AI模型现在可以建模这些完整的复合物,这为靶向蛋白质-蛋白质相互作用界面提供了结构基础。对于其他靶点(如动态采样广泛构象组合的蛋白质),挑战在于其极高的灵活性。这里的关键不一定是更长的分子动力学模拟,而是构象空间更广泛的采样,以识别瞬时的、可成药的口袋。例如,Anton超级计算机就使用了这种“不要求更长,但要求更广”的方法,在传统的不可成药靶点上找到了隐秘的结合位点。这突显了一类独特的动态可成药靶点。

AI对于开发与特定靶点类别相匹配的全新治疗模式也至关重要。一个典型的例子是转录因子MYC,该高价值癌症靶点长期以来被认为不可成药。对于此类功能由其分配到生物分子凝聚物所介导的靶点,AI可用于预测和设计调节凝聚物动力学的分子,这提供了一种绕过直接酶抑制的治疗策略。对于大约40%包含固有无序区域的人类蛋白质,像RFdiffusion这样的生成式AI系统可以设计新型生物制剂来结合这些以前无法触及的表面。

图2 使用RFdiffusion进行蛋白质设计。

当直接靶向致癌基因被证明不可行时,AI驱动的系统生物学提供了一个强大的替代方案。通过整合大规模功能性基因组学和转录组学数据,AI模型可以识别不可成药靶点的合成致死伙伴,并揭示在药理学上可及的替代弱势环节。类似地,整合多组学数据可以精确定位靶点通路中可成药的下游效应器或上游调节因子,为治疗干预提供间接途径。AI还增强了我们追求多药理学的能力,即通过精心设计的多靶点结合实现治疗效果。这些例子强调了对超越简单二元标签并指导将正确的工具应用于正确问题的分类系统的需求。

不可成药靶点的基准测试需求迫切
AI的成功高度依赖于高质量数据,这个问题对于不可成药靶点而言尤为严峻,因为其数据集小、失败常见且很少发表。为了验证和改进针对这些挑战性应用的AI模型,学界必须开发针对特定不可成药类别的标准化、公共基准数据集。

通用基准测试是不够的:需要精心策划的挑战来测试特定的AI能力。例如,为了验证旨在寻找瞬态口袋的模型,应使用一组实验上发现了隐秘或变构位点的蛋白质作为基准集。需要有包含实验确定的破坏结合的界面突变复合物的数据集,以验证破坏蛋白质-蛋白质相互作用的模型,从而使得对AI预测“热点”残基的能力进行基准测试成为可能。例如,一个评估预测凝聚物行为调节模型能力的稳健基准,对于验证针对像MYC这样的靶点的方法将是至关重要的。此外,像DSMBind这样利用稀缺数据预测结合能量的AI方法,必须对照特征明确的阴性数据集——失败的筛选活动的“暗物质”——进行验证,以确保它们能够区分真正的结合物与诱饵。像OpenBind和OpenADMET这样的举措是创建这些资源的至关重要的第一步。

重新思考临床转化与安全性
将AI设计的针对不可成药靶点的治疗药物转化到临床应用,给安全性和验证带来了独特的挑战。许多此类靶点之所以被避开,正是因为它们是细胞信号传导的中心节点,在健康组织中扮演着重要角色。因此,安全范式必须演进。用于安全性的AI模型必须超越仅预测与少数已知抗性靶点的结合,转而预测组织特异性的下游后果以及在整个人类蛋白质网络中的通路扰动。这对于新兴模式(如凝聚物调节剂)尤为关键,系统水平的安全性视角可以更深入地了解靶点活性和潜在的脱靶效应。

此外,临床验证策略需要革新。对于一个旨在改变像MYC这样的靶点在凝聚物中分配的治疗药物,传统的基于占位效应的生物标志物可能无关紧要。该领域必须开创新的方法,例如开发测量靶点参与下游后果的蛋白质组学或成像生物标志物。尽早与监管机构沟通——例如通过美国食品药品监督管理局(FDA)的“复杂创新试验设计会议计划”12等途径——对于共同制定针对这些新型生物标志物和终点的适当框架至关重要。

前进之路解决这些挑战需要一个协调的、竞争前的生态系统。根据我们的讨论,我们提出三个目标以促进进展。首先,我们提议为不可成药靶点创建一个联合数据库,该数据库应包含功能性分类法,并能够收录阳性以及(至关重要的是)阴性实验结果——鉴于知识产权担忧,这是一个主要障碍,但可能通过竞争前数据信托或可保护专有信息的联邦学习模型得以解决。第二,我们呼吁整个学界共同致力于创建上述开源模型、标准化应用程序接口(API)和特定基准数据集。这将降低进入门槛并加速创新步伐。第三,来自美国国家癌症研究所(NCI)、能源部(DOE)和高级健康研究计划局(ARPA-H)等机构的持续、协调投资至关重要,以构建数据基础设施、资助针对新型模式的高风险高回报研究,并与FDA等监管机构合作,共同为这些新型治疗类别制定框架。

结论
如今,人工智能与新型治疗模式正相互融合,系统性地解锁不可成药蛋白质组。作为一个群体,我们必须超越孤立的努力,构建一个协作框架。这涉及采用更细致的靶点分类法,构建目标驱动的数据集和基准以验证我们的模型,并开创临床转化的新策略。前进之路需要一场向彻底协作转变的文化革新,但潜在的回报——驱动人类疾病的治疗靶点的根本性扩展——是巨大的。

相关文章 更多 >