通过机器学习更快地发现药物
药物只有附着在体内的目标蛋白质上才能起作用。评估黏性是药物发现和筛选过程中的一个关键障碍。结合化学和机器学习的新研究可能会降低这一障碍。
这种被称为DeepBAR的新技术可以快速计算出候选药物与其靶标之间的结合亲和力。与以前最先进的方法相比,这种方法只需一小部分时间就能得到精确的计算结果。研究人员表示,DeepBAR有朝一日可能会加快药物发现和蛋白质工程的步伐。
“我们的方法是数量级的速度比以前更快了,这意味着我们可以高效和可靠的药物发现,”本说张pfizer-Laubach职业发展在麻省理工学院的化学教授,副教授广泛的麻省理工学院和哈佛大学的成员,和描述技术的一篇新论文的作者之一。
这项研究今天发表在《物理化学快报》杂志上。这项研究的主要作者是麻省理工学院化学系博士后丁新强。
药物分子和目标蛋白之间的亲和力是通过一个叫做“结合自由能”的量来测量的——这个量越小,结合就越有粘性。“较低的结合自由能意味着药物可以更好地与其他分子竞争,”张说,“这意味着它可以更有效地破坏蛋白质的正常功能。”计算候选药物的结合自由能提供了药物潜在有效性的一个指标。但这是一个很难确定的数量。
计算束缚自由能的方法分为两大类,每一类都有其自身的缺点。一类是精确计算数量,消耗大量时间和计算机资源。第二类在计算上花费较少,但它只能得到束缚自由能的近似值。张和丁设计了一种兼顾两种情况的方法。
准确和高效
DeepBAR精确地计算了束缚自由能,但它所需要的计算只是以前方法的一小部分。这项新技术将传统化学计算与机器学习的最新进展相结合。
DeepBAR中的“BAR”代表“Bennett接受率”,这是一个已有几十年历史的算法,用于精确计算束缚自由能。使用伯纳特接受比通常需要两个“端点”状态的知识(例如,一个药物分子与蛋白质结合和一个药物分子完全与蛋白质分离),加上许多中间状态的知识(例如,不同程度的部分结合),所有这些都会降低计算速度。
DeepBAR通过在被称为“深度生成模型”(deep generate models)的机器学习框架中部署贝内特接受率,来削减这些中间状态。“这些模型为每个端点创建一个引用状态,即绑定状态和未绑定状态,”Zhang说。这两种参考状态非常相似,因此可以直接使用贝内特接受比,而无需所有代价高昂的中间步骤。
在使用深度生成模型时,研究人员借鉴了计算机视觉领域。“这与人们用于计算机图像合成的模型基本相同,”张说。“我们在某种程度上把每个分子结构当作一幅图像,这是模型可以学习的。所以,这个项目是建立在机器学习社区的努力之上的。”
尽管将计算机视觉方法用于化学是DeepBAR的关键创新,但交叉也带来了一些挑战。“这些模型最初是为2D图像开发的,”丁说。“但这里我们有蛋白质和分子——这是一个真正的3D结构。所以,在我们的案例中采用这些方法是我们必须克服的最大技术挑战。”
药物筛选的更快的未来
在使用类似蛋白质的小分子的测试中,DeepBAR计算束缚自由能的速度比以前的方法快近50倍。张说,效率意味着“我们可以真正开始考虑使用它来进行药物筛查,特别是在Covid - 19的情况下。DeepBAR具有与黄金标准相同的准确性,但它要快得多。”研究人员补充说,除了药物筛选,DeepBAR还可以帮助蛋白质设计和工程,因为这种方法可以用来模拟多种蛋白质之间的相互作用。
加州大学圣迭戈分校(University of California at San Diego)药物学教授迈克尔?吉尔森(Michael Gilson)表示,DeepBAR是“一项非常出色的计算工作”,在应用于现实世界的药物发现之前,需要克服一些障碍。吉尔森没有参与这项研究。他说,DeepBAR需要用复杂的实验数据来验证。“这肯定会带来更多的挑战,可能需要进一步增加估计值。”
未来,研究人员计划提高DeepBAR计算大型蛋白质的能力,最近计算机科学的进展使这项任务成为可能。“这项研究是将几十年来发展起来的传统计算化学方法与机器学习的最新发展相结合的一个例子,”丁说。“所以,我们实现了一些以前不可能实现的事情。”
# # #
这项研究部分由美国国立卫生研究院资助。
作者是麻省理工学院新闻办公室的丹尼尔·阿克曼
额外的背景
论文:“DeepBAR:一种快速精确的束缚自由能计算方法”https://pubs.acs.org/doi/abs/10.1021/acs.jpclett.1c00189