3D computed structural modeling of protein interactions

通过深度学习和进化分析,蛋白质相互作用的三维计算结构建模成为可能。

科学家们正在结合进化分析和深度学习的最新进展,建立真核生物中大多数蛋白质相互作用的三维模型。

这项研究成果对理解所有动物、植物和真菌共有的生物化学过程具有重要意义。这项开放获取的研究发表在11月11日的《科学》杂志上。

作为多机构合作的一部分,大卫·贝克在华盛顿大学蛋白质设计医学研究所的实验室帮助指导了这一新的发展。

贝克说:“要真正了解导致健康和疾病的细胞条件,就必须知道细胞中不同的蛋白质是如何一起工作的。在这篇论文中,我们提供了真核细胞中几乎每个核心过程的蛋白质相互作用的详细信息。这包括100多种以前从未见过的互动。”

蛋白质是所有细胞的主力军,它很少单独起作用。不同的蛋白质通常必须结合在一起,形成精确的复合物来执行特定的任务。这包括读取基因,消化营养,以及对邻近细胞和外部世界的信号做出反应。当蛋白质复合体失灵时,就会导致疾病。

德克萨斯大学西南医学中心生物物理学助理教授、资深作者Qian Cong说:“这项工作表明,深度学习现在可以对生物学中几十年的老问题产生真正的见解——不仅是某一特定蛋白质的样子,还包括哪些蛋白质会相互作用。”

为了详尽地描绘出产生蛋白质复合物的相互作用,一个由华盛顿大学医学院、德克萨斯大学西南医学中心、哈佛大学和其他几个机构的结构生物学家组成的团队检查了酵母中所有已知的基因序列。利用先进的统计分析,他们发现了一些基因,它们以一种相互关联的方式自然地获得突变。他们认为,这种共有的突变是基因编码的蛋白质必须在物理上相互作用的信号。

研究人员还使用了新的深度学习软件来模拟这些相互作用的蛋白质的三维形状。华盛顿大学医学学院(UW Medicine)发明的RoseTTAFold和Alphabet子公司DeepMind发明的AlphaFold都被用来生成数百张蛋白质复合物的详细图片。

贝克是华盛顿大学医学院生物化学教授,他说:“随着计算机方法变得越来越强大,它比以往更容易产生大量的科学数据,但要理解它仍然需要科学专家。所以我们招募了一个生物学专家来解释我们的3D蛋白质模型。这是最好的联盟科学。”

数百种新发现的蛋白质复合物为研究细胞功能提供了丰富的见解。例如,其中一个复合物含有蛋白质RAD51,已知它在人类的DNA修复和癌症进展中发挥着关键作用。另一种包括鲜为人知的糖基磷脂酰肌醇转氨酶,这种酶与人类神经发育障碍和癌症有关。了解这些蛋白质和其他蛋白质是如何相互作用的,可能会为开发治疗各种健康疾病的新药物打开大门。

在这项工作中生成的蛋白质结构可以从ModelArchive下载。研究人员感谢已故的约翰·韦斯特布鲁克,他在建立格式和软件代码方面给予了支持,使模型能够有效地沉积到档案中。在威斯布鲁克去世时,《科学》杂志报道这一成果的论文正在准备中。

Computed structures of core eukaryotic protein complexes