2010年,人类蛋白质组组织(HUpO)启动了人类蛋白质组计划(Hpp),其目标是将蛋白质组数据与基因序列信息有效融合,促进全球分子生物学家之间更有效的合作。如今,在十周年之际,人类蛋白质组计划达到了一个重要的里程碑,覆盖了90.4%的人类蛋白质。

这张最新的人类蛋白质组蓝图于近日发表在《Nature Communications》杂志上,同时也发表在《Journal of proteome Research》杂志上。早前,人们预测人类基因组共编码19,773个蛋白质,研究人员目前已经检测到17,874个。

根据NeXtprot数据库的最新数据(release 2020-01),17,874个蛋白质(90.4%)在蛋白质水平上有足够的实验证据(pE1)。其中,有16,924个蛋白质通过质谱验证,而其余950个通过非质谱方法(比如免疫检测)得到验证。另外,1,899个蛋白质被认为是缺失的(pE2、pE3、pE4),没有实验证据。

尽管人类蛋白质组计划将继续鉴定其余10%的预测蛋白质,但近年来这个过程会变得更加缓慢,也更加困难,因为许多蛋白质要么仅在特殊且难以获得的组织类型中表达,要么是传统的蛋白质组学技术难以分离和分析的。

例如,JpR文章作者指出,在尚未检测到的1,899个蛋白质中,多达1,000个在转录本水平上也未被检测到。嗅觉受体一直是该计划的一个主要难点。到目前为止,人们未发现399个已知的嗅觉受体基因中任何一个的蛋白质,包括在嗅上皮标本的分析中。

人类蛋白质组计划的主席、系统生物学研究所蛋白质组学中心主任Robert Moritz表示,随着完成蛋白质组调查的进度放缓,蛋白质组学领域已从蛋白质的鉴定和分类转移到探索其生物学功能和疾病相关性,人类蛋白质组计划同样也在探索蛋白功能,并开发新的研究资源。

Moritz指出,人类蛋白质组计划的主要目标是通过提供如何检测蛋白质的信息来扩大人们可研究的蛋白质数量。“绝大多数的研究都是针对极少数的蛋白质开展的,因为它们很容易被检测到,而且试剂就在那里,”他说。

“这就是我们一直在努力做的事情,首先要了解蛋白质组的成分清单,然后围绕每种蛋白质建立资源,让人们可以通过质谱法、或Edman降解法、甚至是新出现的技术来研究它,”Moritz说。

展望未来,人类蛋白质组计划已经确定了许多重点领域,包括加大努力鉴定每种人类蛋白的不同形式,并开发和制造优化的检测方法来检测已鉴定的蛋白质,包括低丰度蛋白和其他方法难以检测的分子。(生物通 薄荷)

原文检索

Adhikari, S., Nice, E.C., Deutsch, E.W. et al. A high-stringency blueprint of the human proteome. Nat Commun 11, 5301 (2020). https://doi.org/10.1038/s41467-020-19045-9

The HUpO High-Stringency Inventory of Humanity’s Shared Human proteome Revealed

Research on the Human proteome Reaches a Major Milestone: >90% of predicted Human proteins Now Credibly Detected, According to the HUpO Human proteome project