首页 > 资讯 > 世界 > 正文
2024-05-06 19:40 浏览:3

生成式人工智能加速抗病毒药物开发和药物发现的潜力

Breakthrough Research shows potential for generative AI to accelerate development of new antivirals and drug discovery

在一项新的研究中,来自IBM、牛津大学和Diamond Light Source的研究人员表明,IBM的人工智能模型MoLFormer可以为包括SARS-CoV-2在内的多种目标病毒蛋白生成抗病毒分子,这可以加速药物发现过程,并加强我们对未来流行病的反应。

研究结果发表在《科学进展》杂志上的一篇新论文中,在论文提交时,牛津大学的研究人员成功地验证了11种分子的抗病毒特性。这一突破有可能在下一次危机中更快地为人们提供药物,并为紧急的、危及生命的疾病提供治疗。

在大流行早期,IBM的一组计算机科学家想要探索是否可以使用生成式人工智能来设计从未见过的分子,以阻止导致COVID-19的病毒SARS-CoV-2。牛津大学临床医学系结构生物学系主任、英国国家同步加速器Diamond Light Source生命科学主任大卫·斯图尔特(David Stuart)解释说,他最初是持怀疑态度的,他是研究HIV、SARS和埃博拉病毒等病原体的权威。他说:“你可以拿一个蛋白质序列,用人工智能从稀薄的空气中提取化学物质,这些化学物质会与病毒的3D位点结合,这种想法似乎是不太可能的。”

然而,他和马丁·沃尔什(Martin Walsh)也是一位结构生物学专家和戴蒙德生命科学副主任,他与IBM团队合作,在三年的时间里,与乌克兰的化学供应商Enamine Ltd.和牛津大学的其他研究人员合作,证明了生成式人工智能可以“无中生有地获取抗病毒药物的可行起点”。

因为生成模型也是一个基础模型,预先训练了大量的原始数据,所以它的用途足够广泛,可以为多种蛋白质目标创建新的抑制剂,而无需额外的训练或任何3D结构的知识。

斯图尔特和沃尔什的研究小组已经开始研究两种重要的SARS-CoV-2蛋白,即刺突蛋白和主要蛋白酶。利用这些靶点,研究小组在使用传统方法所需的一小部分时间内,成功地找到了四种潜在的COVID-19抗病毒药物。然后,这项工作利用Diamond的高通量大分子晶体学光束线来可视化AI的一个子集如何生成与主要蛋白酶结合的化合物。

他们的研究成果发表在《科学进展》杂志上,IBM还发布了一个基于网络的界面,用于与IBM Cloud中的模型和类似的化学基础模型进行交互。

该团队表示,在公司可能将其转化为药物之前,经过验证的分子还有许多障碍需要清除,包括临床试验。但是,即使人工智能产生的“热门药物”永远不会变成实际的药物,这项工作也证实了,生成式人工智能在未来的药物开发中发挥着重要作用,尤其是在危机时期。

“开发和验证这些方法需要时间,但现在我们有了一个工作管道,我们可以更快地产生结果,”该研究的资深作者之一、IBM研究院的研究员帕耶尔·达斯(Payel Das)说。“当下一种病毒出现时,生成式人工智能可能是寻找新疗法的关键。”

Diamond的联合资深作者Martin Walsh说:“产生与感兴趣的药物靶点高亲和力结合的初始化合物加速了基于结构的药物发现管道,并支持我们为更好地应对未来的流行病做好准备的努力。

研究人员在一种被称为变分自动编码器(VAEs)的生成式人工智能架构上建立了他们的模型,即受控分子生成(CogMol)。VAEs将原始数据编码为压缩表示,然后解码或翻译回原始样本的统计变化。他们的模型是在一个大的分子数据集上训练的,这些分子数据集以文本字符串的形式表示,同时还有关于蛋白质及其结合特性的一般信息。但他们故意遗漏了有关SARS-CoV-2的3D结构或已知与其结合的分子的信息。他们的目标是为他们的生成基础模型提供一个广泛的知识基础,这样它就可以更容易地部署到以前从未见过的分子设计任务中。

他们的目标是找到能与两个COVID蛋白目标结合的类药物分子:将病毒传播到宿主细胞的刺突和帮助传播病毒的主要蛋白酶。尽管当时这两种蛋白质的3D结构已经被发现,但IBM的研究人员选择只使用它们的氨基酸序列,这些氨基酸序列来源于它们的DNA。通过这种方式限制自己,他们希望模型能够在不知道目标形状的情况下学会生成分子。

研究人员只将每个蛋白质目标的氨基酸序列输入到CogMol中,CogMol在三天内产生了87.5万个候选分子。为了缩小范围,研究人员通过IBM RXN化学反合成平台对候选药物进行了测试,以了解合成这些化合物需要哪些成分。根据平台预测的配方,他们为每个目标选择了100个分子。Enamine的化学家们进一步将每个目标分子的清单缩减为四个分子,选择了那些被认为最容易制造的分子。

在合成了8种新分子后,Enamine将它们运送到牛津大学,在克里斯·斯科菲尔德教授和加文·斯克雷顿教授的实验室里测试它们破坏两种蛋白质目标功能的能力。钻石产生的强x射线束比太阳亮100亿倍,用来观察化合物如何与蛋白质相互作用以使其功能失活。对新化合物进行了进一步的靶抑制和活病毒中和试验。两种有效的抗病毒药物靶向主要蛋白酶;另外两个不是0仅针对刺突蛋白,但事实证明能够中和所有六种主要的COVID变体。“你会得到一张地图,上面显示了确切的地点东西捆绑在一起,砰!你有个骗局“坚定,”斯图亚特说。Breakthrough Research shows potential for generative AI to accelerate development of new antivirals and drug discovery

CogMol是IBM开发的几个化学基础模型之一。最大的MoLFormer-XL是在超过11亿个分子的数据库上训练的,目前正被Moderna用于设计mRNA药物。该研究的资深作者之一、IBM研究院研究员、牛津大学教授杰森·克雷恩(Jason Crain)说:“我们使用对其蛋白质目标知之甚少的生成基础模型,为加速抗病毒药物的开发创造了有效的起点。”“我希望这些方法能让我们在未来更快、更便宜地制造出抗病毒药物和其他迫切需要的化合物。”

尽管研究人员专注于验证针对COVID的抗病毒药物,但他们认为,这些方法可以扩展到现有的持续变异的病毒,如流感,或尚未出现的病毒。斯图尔特总结说:“如果你想为下一次大流行做好准备,你就需要对蛋白质的不同位点起作用的药物。”“病毒就更难逃脱了。”