照亮黑暗的蛋白质组:我们的许多蛋白质仍然隐藏在黑暗的蛋白质组中
当20年前人类基因组序列被公布时,科学家预测大约有2万个蛋白质编码基因。到目前为止,研究人员已经发现了18000多个证据。其余的蛋白质,以及修饰过的蛋白质和那些结构和功能未知的蛋白质,组成了“暗蛋白质组”。美国化学学会的独立新闻媒体《化学与工程新闻》的封面故事描述了科学家们是如何寻找这些隐藏的蛋白质的。
高级编辑劳拉·豪斯(Laura Howes)写道,利用质谱和其他分析技术,研究人员发现了预测存在的蛋白质中略多于90%的踪迹。其中一些未知蛋白质可能在健康和疾病中发挥重要作用,但它们可能会逃避检测,因为它们是零星的、低水平的表达,或仅在某些组织中表达。另外,这些蛋白质也可能缺乏某些特性,比如胰蛋白酶消化位点,而这些特性可以被目前的技术检测到。研究人员正在开发新的方法——例如,用酶而不是胰蛋白酶消化蛋白质,准备样品进行质谱分析——但回报不能保证,而且暗蛋白质组的其他区域仍有待探索。
一个暗区包括“已知的”蛋白质,具有多种形式和修饰。单基因的信使RNA有时可以以多种方式拼接在一起,产生不同的版本,或“异构体”。蛋白质的异构体在人体不同部位的作用略有不同。蛋白质也可以以不同的方式进行化学修饰,比如添加糖分子或甲基。研究人员正在开发新的分析工具,以更灵敏地探索黑暗蛋白质组的这一区域。另一个区域包括结构或功能未知的蛋白质。基于人工智能(AI)的方法正在帮助预测一些黑暗结构,科学家希望这将为蛋白质的功能提供线索。其他有关功能的线索可以来自基因沉默实验和预测蛋白质相互作用伙伴的人工智能算法。专家们说,黑暗蛋白质组中可能还有科学家们甚至不知道的区域,这将使研究人员在未来几年里对这些谜团保持好奇。
该文章可在https://cenm.ag/darkproteome下载