文章

Nature新闻:全球首个AI设计的病毒问世

2025-09-22     来源:智药邦     点击次数:47

文章来源公众号:智药邦         作者:智药邦

在生命科学领域,人工智能的应用正以前所未有的速度,重塑我们对生物系统的理解和改造能力。

2025年9月19日,Nature发表新闻文章World’s first AI-designed viruses a step towards AI-generated life,评述了Hie、King及其同事近期的一项AI设计病毒的研究。

2025年9月17日,由Hie、King及其同事在bioRxiv发表研究的Generative design of novel bacteriophages with genome language models,带来了一项突破性的进展:首次利用基因组语言模型成功设计了功能性噬菌体(bacteriophage)的全基因组,并实验验证了其感染性和生物学特性。这项研究标志着人工智能驱动的全基因组设计迈出了关键一步。



加州斯坦福大学计算生物学家Brian Hie表示:"这是人工智能系统首次能够编写具有连贯性的基因组规模序列。下一步将是AI生成的生命。希望这类策略能够补充现有的噬菌体疗法,并最终增强针对特定病原体的治疗手段。"

但他的同事Samuel King指出:"要设计完整的活体生物,还需要取得许多实验进展。"

计算机生成的基因组

AI模型先前已被用于生成DNA序列、单蛋白及多组分复合物。但由于基因间复杂的相互作用以及基因复制与调控过程,设计完整基因组更具挑战性。

Hie表示:"如今这些AI系统能帮助科学家操控高度复杂的生物系统,例如完整基因组。许多重要生物功能只有通过设计完整基因组才能实现。"

研究人员使用能够分析生成DNA、RNA和蛋白质序列的AI模型Evo1和Evo2设计病毒基因组。他们首先选定ΦX174噬菌体作为设计模板——这种简单的单链DNA病毒包含5,386个核苷酸构成的11个基因,具备感染宿主并在宿主体内复制的全部遗传元件。

图1 Evo生成真实噬菌体基因组序列

Evo模型虽已接受200多万个噬菌体基因组的训练,但研究人员通过监督学习进一步训练模型生成具有感染大肠杆菌功能的类ΦX174病毒基因组,重点针对抗生素耐药菌株。研究人员评估数千个AI生成的序列后,筛选出302个可行的噬菌体方案。大多数候选方案与ΦX174的核苷酸同一性超过40%,部分方案则具有完全不同的编码序列。图2 噬菌体基因组设计筛选的补充数据

研究人员合成了这些AI设计的基因组DNA,将其插入宿主细菌培育噬菌体。实验测试发现,302个AI设计的噬菌体中有约16个表现出对大肠杆菌的宿主特异性感染能力。研究人员还发现,组合使用的AI设计噬菌体可感染并杀死三种不同大肠杆菌菌株——野生型ΦX174菌株无法做到这一点。

图3 合成噬菌体基因组设计候选物的比对

生物安全问题

纽约冷泉港实验室计算生物学家Peter Koo评价:"这项研究展示了当今技术的可能性,为未来更宏大的应用奠定了基础"。他同时指出,Evo模型仍需团队干预引导才能设计病毒,但整个系统流程表明该方法可能产生功能性基因组。

关于AI设计危害人类病毒的伦理问题,德国海德堡大学生物物理学家Kerstin Göpfrich表示:"这种'双重用途困境'并非AI独有,始终存在于生物学领域。"研究人员在论文中强调排除了涉及真核生物(包括人类)的病毒训练数据,且研究的ΦX174噬菌体和大肠杆菌宿主系统具有"长期的分子生物学研究安全使用史"。

研究人员希望该方法今后能安全生成AI设计的病毒,用于治疗细菌耐药性等公共卫生问题。Göpfrich预测:"这必将成为蓬勃发展的领域,令我无比振奋。"

意义与前景

此项研究首次实现了利用基因组语言模型设计功能完整的噬菌体基因组。其建立的计算框架(涵盖新的基因注释方法和多样化的评估指标)、可控的设计流程(可引导至目标基因组结构和宿主趋向),以及实验验证策略(成功产生16个功能性噬菌体),为生成基因组学(generative genomics)领域提供了宝贵蓝图。

图4 预测ΦX174样序列中基因的方法

该研究的意义在于:第一,它为探索全新的、自然界中尚未发现的进化空间提供了强大的策略。生成的噬菌体在序列多样性和结构创新方面均展示了实质性突破,如Evo-Φ2147已达到可被归类为新噬菌体物种的低序列同源性(<95% ANI)。第二,它为设计具有更高活力和更快裂解动力学的高适应性基因组提供了高效手段,这对噬菌体相关生物技术的应用至关重要。第三,它初步证明了AI设计产生的多样化噬菌体在混合疗法中快速克服细菌耐药性的巨大潜力,为解决抗生素耐药性(antibiotic resistance)提供了新思路。最后,也为未来设计基因组更大、更复杂的生物系统奠定了基础。

随着基因组语言模型能力的持续提升,以及DNA合成与组装技术的不断发展,我们有望看到生成基因组设计扩展到更复杂的病毒模型,甚至最终迈向完整生命体的设计。这项研究不仅是合成生物学(synthetic biology)与人工智能融合的里程碑,更预示着未来的生物技术工具箱中,基因组设计将与基因组测序、合成、编辑并驾齐驱,成为一项核心技术。​

相关文章 更多 >