Nature:脊椎动物基因组项目成果上线啦!进入基因组测序新时代
脊椎动物基因组计划(VGp)今天宣布了其旗舰研究和相关出版论文,重点关注基因组学组装质量和基因组学领域的标准化。这些研究包括16个高质量,近乎无错误且近乎完整的脊椎动物参考基因组,针对主干所有类群,即哺乳动物,两栖动物,鸟类,爬行动物和鱼类的物种。
Nature杂志以特刊形式发布了这些成果,同时还有其它论文在其它科学期刊上发表,VGp详细介绍了基于这16种基因组装配的众多技术改进。在旗舰研究中,VGp展示了使用其最先进的自动方法(将长读长和长距离染色体支架方法与新颖的算法相结合)来设置和实现高质量参考基因组质量指标的可行性。
基因组组装一直困扰着科学家们,VGp的方法将“装配流水线”与“手动管理”相结合,修复装配不当,重大缺陷和其他错误,从而为迭代开发更好的算法提供了信息。例如,VGp帮助揭示了高水平的假基因重复,丢失或增加,这主要是由于算法无法正确分离母本和父本染色体。一种解决方案包括三重装仓方法,该方法使用来自亲本的DNA来分离后代中的父本和母本序列。对于无法获得父母数据的情况,VGp开发的另一种解决方案是一种称为FALCON-phase的算法,该算法可降低在染色体规模上分阶段确定母本和父本DNA序列的计算复杂性。
实现了VpG精确分析基因组组装,可帮助获得前所未有的新颖发现,这些发现对于表征生物多样性,保护人类健康和发现疾病机制具有重要意义。
比如由Bat 1K联盟产生的六个蝙蝠物种的第一个高质量参考基因组,揭示了与免疫相关的基因的选择和丧失,这些基因可能是蝙蝠对病毒感染的独特耐受力的基础。这一发现为提高生存能力提供了新颖的研究途径,尤其这还与新兴传染病(例如当前的COVID-19大流行)有关。
剑桥大学教授,Sang二研究所VGp测序中心负责人Richard Durbin表示:“这些研究标志着基因组测序新时代的开始,该时代将在未来十年内加速发展,实现基因组在整个生命树中的应用,改变了我们与生活世界的科学互动。”
德国马普研究所VGp测序中心的负责人Gene Myers阐述道:“ VGp项目处于创建类似于Linnaeus生命分类的基因组目录的先锋。我和我的同事很高兴能在马普学会的资助下为出色的基因组重建做出贡献。”
自2016年发起以来,VGp吸引了来自12个国家/地区的50多个机构的数百名国际科学家共同合作,在其科学合作,广泛的基础设施和协作领导方面堪称典范。此外,由于第一个大规模真核生物基因组计划生产满足特定最低质量标准的参考基因组装配,因此VGp已成为其他大型协会的工作模型,包括Bat 1K,pan Human Genome project,Earth BioGenome project,达尔文生命之树,以及欧洲参考基因组图谱等。
下一步,VGp将继续在全球范围内与其他协会合作完成该项目的第一阶段,每260个脊椎动物订单中大约有一个代表性物种。VGp计划与这260个物种建立比较基因组资源,包括无参考的全基因组比对,这将提供一种手段来了解这些物种的详细进化史,并创建一致的基因注释。基因组数据主要是在三个测序中心产生的,这些中心已接受了VGp的任务,包括美国纽约洛克菲勒大学的Vertebrate Genome Lab;英国Sanger研究所;和德国马普研究所。
第二阶段将集中于每个脊椎动物家族的代表性物种,目前正在样品鉴定和筹集资金的过程中。VGp实行开放政策,欢迎其他各方共同努力,从筹款和样品采集到生成基因组装配,或包括符合VGp指标的自己的基因组装配,作为总体使命的一部分。
VGp与基因组测序公司合作并测试了许多方案,其中一些科学家也是该旗舰研究的合著者,包括pacific Biosciences,Oxford Nanopore Technologies,Illumina,Arima Genomics,phase Genomics和Dovetail Genomics。 VGp还与DNAnexus和亚马逊合作,生成了一个公开可用的VGp组装途径,并将基因组数据托管在Genome Ark数据库中。基因组,注释和比对还可在国际公共基因组浏览和分析数据库中找到,包括National Center for Biotechnology Information Genome Data Viewer, Ensembl genome browser, 和UC Santa Cruz Genomics Institute Genome Browser。所有数据都是开源的,并且根据G10K数据使用政策公开可用。
在第一批发布的20多篇论文中,获得了新颖的生物学发现包括:
-纠正了错误的基因或染色体丢失概念,以前的程序丢失了富含GC的蛋白质编码基因调控区域的30%至50%,这些区域被认为属于基因组的“暗物质”;
-在斑胸草雀和鸭嘴兽中新发现染色体;
-多数物种的线粒体基因组完整无误,有些不需要单独组装即可以单分子序列生成;
-极端哺乳动物和鸟类的野生性染色体进化;
-人类与狨猴之间的遗传变异,将狨猴作为一种新兴的非人类灵长类动物模型用于生物医学研究,具有重要意义;
-特定于世系的变化影响着鸟类和哺乳动物基因组的进化
-提议为催产素和vasotocin配体和受体家族基于通用进化的修订命名法。
与此包相关的所有论文的链接都可以在Nature的网站上找到。
(生物通:万纹)
原文链接:
http://dx.doi.org/10.1038/s41586-021-03451-0
Arang Rhie et al. "Towards complete and error-free genome assemblies of all vertebrate species." Nature. published online April 28, 2021. doi: 10.1038/s41586-021-03451-0