Science填补空白:通过蛋白质将基因与疾病联系起来
由剑桥大学医学研究委员会(MRC)流行病学组的科学家领导的一个国际研究团队,通过我们基因组中的共同起源,发现了数百种不同人类疾病之间的联系,挑战了按器官、症状或临床特征对疾病的分类。
发表在《科学》(Science)杂志上的一项新研究获得了我们血液中数千种循环蛋白质的数据,并将这些数据与遗传数据结合,绘制出了一幅地图,显示了影响这些蛋白质的遗传差异如何连接在一起,以及相关疾病。
蛋白质是人体的基本功能单位,由氨基酸组成,由我们的基因编码。在大多数医学专业和器官系统中,蛋白质的故障都会导致疾病,而且蛋白质也是目前存在的药物最常见的靶标。
今天发表的研究结果有助于解释为什么看似无关的症状会同时发生在患者身上,并建议我们应该重新考虑,相同的潜在蛋白质或机制如何能引起多种疾病。当蛋白质成为药物靶点时,这些信息可以为治疗各种疾病提供新的策略,并将不良反应降至最低。
在这项研究中,研究人员使用了芬兰研究中一万多名参与者的血液样本,该研究由资深作者克劳迪娅·兰根伯格博士领导,她就职于医学研究委员会流行病学小组和德国柏林健康研究所(Charité Universit?tsmedizin, Germany),证明了人类基因组2500个区域的自然变异与血液中循环的5000种蛋白质的丰度或功能的差异密切相关。
这种方法解决了将基础科学转化为临床可操作见解的一个重要瓶颈。虽然对人类基因组的大规模研究已经在我们的DNA序列中发现了数千种与疾病相关的变异,但由于在将这些变异映射到基因上的过程中存在不确定性,人们往往对其潜在的机制知之甚少。通过将这些与疾病相关的DNA变异与编码蛋白质的丰度或功能联系起来,该团队提供了基因参与的有力证据,并确定了蛋白质介导疾病发病遗传风险的新机制。
例如,多项全基因组关联研究(GWAS)已经将人类基因组KAT8区域与阿尔茨海默病联系起来,但未能确定该区域的哪个基因参与了该疾病。通过结合蛋白质和基因的数据,该团队能够在KAT8区域识别出一个名为pRSS8的基因,它编码蛋白质前列腺素,作为阿尔茨海默病的一个新的候选基因。同样,他们发现了一种新的子宫内膜癌风险基因(RSpO3)。
作者利用这些新发现系统地测试了这些蛋白质编码基因中哪些影响了大范围的疾病。他们发现了1800多个例子,其中不止一种疾病是由单个基因及其蛋白质产物的变异驱动的。由此产生了人类疾病的网状结构,因为许多基因连接了一系列看似不同的以及不同组织中相关的条件。这提供了强有力的证据,证明各自的蛋白质是起源,并指出了新的潜在治疗策略。
Langenberg博士解释说:“我们发现一种蛋白质与多种疾病有关的一个极端例子是纤维蛋白3 (Fibulin-3),我们发现它与37种疾病有关,包括运动过度、疝、静脉曲张,以及腕管综合症的低风险。”一种可能的解释是,覆盖我们器官和关节的弹性纤维的非典型形成,导致了软组织和结缔组织的弹性差异。这也符合其他人在老鼠身上观察到的基因被删除的特征。”
Maik pietzner博士是MRC流行病学小组的研究员,也是该研究的主要作者之一,他补充道:“以我们的基因组为基础是这项研究成功的关键。因为我们知道,在血液中检测到的大多数蛋白质来源于其他组织的细胞,所以我们整合了不同的生物层,比如基因表达,使我们能够追溯蛋白质到与疾病相关的组织。例如,我们发现,胆盐磺基转移酶活性的升高通过肝脏特异性机制与胆结石风险的增加有关。我们用这种方法将大约900种蛋白质与它们的起源组织连接起来。”
这组作者与德国慕尼黑亥姆霍兹中心的同事合作,开发了一个定制的网络应用程序(www.omicscience.org),使研究结果能够立即传播,并使世界各地的研究人员能够深入研究他们最感兴趣的基因、蛋白质和疾病信息。
埃莉诺·惠勒博士也是MRC流行病学小组的成员,也是这项研究的主要作者之一,她总结道:“对于大多数与疾病风险相关的基因组区域,潜在的致病基因和机制尚不清楚。”我们的工作证明了蛋白质在放大疾病致病基因方面的独特价值,并帮助我们理解遗传变异导致疾病的机制。我们设想,我们与科学界共享的大量信息,将有助于正在进行的和新兴的努力,通过编码蛋白质更直接地将基因与疾病联系起来,从而加速药物靶点的识别。”
参考文献:
pietzner M., Wheeler E., et al.Mapping the proteo-genomic convergence of human diseases.Science2021;14 Oct 2021;DOI:10.1126/science.abj1541
DOI10.1126 / science.abj1541