近年来,一些高质量的人类基因组组装已有报道,但非洲仍然缺乏这样的数据。如果没有可供参考的基因组组装数据,非洲人(特别是具有北非血统的人),就无法了解与疾病相关的风险突变。

为了解决这个问题,德国吕贝克大学Hauke Busch和Saleh Ibrahim领导的研究小组近日结合长读长和短读长测序来生成了埃及人群的参考基因组,这意味着埃及向着精准医学研究迈出了重要的第一步。该成果发表在《Nature Communications》杂志上。

研究人员指出:“在全基因组关联研究中,只有2%的个体是非洲血统,但不同人群之间的遗传病风险可能有所不同,特别是对于非洲个体而言。”他们认为,新的组装将有助于更准确地解释非洲人群的遗传风险。

在这项研究中,研究人员利用pacBio、10x Genomics和Illumina测序数据,获得一名埃及男性的高质量的基因组组装,覆盖度达270倍。这个称为“EGYpT”的组装覆盖2.8 Gb,并且包含20 Mb在GRCh38参考基因组中未出现的新序列。

作者在文中指出,这个组装的质量很高,可与先前测序的韩国个体AK1基因组和非洲约鲁巴个体基因组相媲美。来自尼日利亚的约鲁巴人是最早被测序的非洲人。早在2008年,Illumina就对约鲁巴人的基因组进行了测序。

研究人员还利用短读长测序对110名埃及个体进行测序,并将序列与参考基因组进行比较,以鉴定特定人群的变异。他们报告了近2000万个单核苷酸变异(SNV)以及12万个结构变异(SV)。


从埃及队列中鉴定出的各类遗传变异(图片来自原文)

他们解释说,了解遗传变异是关键,因为埃及人和欧洲人之间存在等位基因频率和连锁不平衡的差异,可能会影响基于欧洲血统的疾病风险预测和多基因风险评分,从而突出了对多种族参考基因组的需求。

非蛋白编码的变异可能具有调控作用,影响基因并最终影响蛋白表达。利用RNA测序获得的血液表达数据以及基于10x Genomics测序的分相变异数据,研究人员确定了有着单倍型表达模式的基因。他们发现,1180个基因在血液中显示出单倍型表达。此外,他们还报告了1198个埃及人群特有的变异,其中49个是新颖的。

研究人员认为,埃及人参考基因组将成为精准医疗中的宝贵资源。人们可以立即使用它提供的大量信息来研究埃及人群的遗传学及其对分子表型和疾病的影响。这个参考基因组将为更好地了解埃及、非洲乃至全球的基因组图谱铺平道路。(生物通 薄荷)

原文检索

Wohlers, I., Künstner, A., Munz, M. et al. An integrated personal and population-based Egyptian genome reference. Nat Commun 11, 4719 (2020). https://doi.org/10.1038/s41467-020-17964-1