张启发院士Nature子刊发表水稻基因组成果
9月13日,在Nature旗下的开放获取杂志《Scientific Data》发表的一项研究中,来自华中农业大学和美国亚利桑那州大学的研究人员,用pacBio的long read测序数据和Illumina双末端测序数据,构建了两个籼稻参考基因组。
我国著名的植物遗传和分子生物学家,华中农业大学作物遗传改良重点实验室主任张启发院士,以及亚利桑那大学的Rod A. Wing教授是这篇论文的共同通讯作者。张启发院士课题组长期致力于水稻基因组研究,旨在通过植物基因组分析、重要基因的分离克隆、杂种优势的遗传和分子基础、作物品种资源的分子评估及应用分子生物学技术进行水稻改良。Rod Wing博士是基因组学研究领域的国际知名专家,目前为亚利桑那大学教授,亚利桑那大学基因组研究所所长,近十几年来共发表论文100多篇,参编专著7部。Rod Wing教授领导的亚利桑那大学基因组研究所是国际闻名的基因组研究机构,在BAC文库构建、末端测序和指纹分析、比较物理图谱构建及分析、表达序列标签整理、结构功能预测等方面具有深厚的工作基础,形成了明显的特色和优势。
今年6月,张启发院士与加州大学河滨分校的Shizhong Xu教授合作,基于代谢组学预测了杂交稻的产量。他们证实相比于基因组预测,当使用代谢组学数据时杂交种产量的可预测性几乎提高了两倍。在源自210个重组自交系的21945个潜在杂交种中,根据代谢物预测选择出的前10个杂交种将使得产量增长~30%。研究结果发布在6月17日的The plant journal杂志上(华中农大张启发院士Theplantjournal发表水稻研究新成果)。
上个月,张启发院士与美国亚利桑那大学的研究人员证实,两种优质籼稻品种珍汕97(Zhenshan 97)和明恢63(Minghui 63)的参考基因组之间有着广泛的序列差异。这项研究发布在2016年8月17日的《美国国家科学院院刊》(pNAS)上(华中农大张启发院士pNAS发表重要水稻研究成果)。
Illumina最新GAIIx 测序仪详细技术资料索取>> >>
水稻是人类的主要作物,已被公认为是生物学研究的一种重要模式生物,尤其是单子叶植物研究。亚洲栽培稻(Oryza sativa)包括两个亚种:粳稻和籼稻。籼稻占全世界水稻产量的70%,并且更加具有遗传多样性。籼稻品种珍汕97(ZS97)和明恢63(MH63)是籼稻的两个主要品种,包含了许多重要的农艺性状,是汕优63(SY63,在中国最广泛种植的杂交水稻)的父母本。
在过去的30年里,ZS97、MH63、SY63杂交系统已被用作一种模型,同时,张启发院士课题组已经对这两个水稻亚种进行了许多基础研究,并进行了一系列的尝试,想对杂种优势这个困扰科学家100多年的生物学谜团的遗传学基础,有一个基本的了解。因此,他们发起了一个联合协作项目,为ZS97和MH63生成两个参考质量基因组装配,作为一种基本的工具来帮助我们了解杂种优势的根本分子遗传基础。
为了提高以往许多调查结果的分辨率,该研究小组使用最先进的测序技术,产生了两个参考质量参考基因组组件。利用pacBio SMRT技术,研究人员从209个(MH63)的BAC克隆库,生成了超过108(ZS97)和174(MH63)Gb的原始序列数据,并用Illumina测序技术产生了~ 97(ZS97)和~ 74(MH63)Gb的末端配对全基因组鸟枪法(WGS)测序数据。
有了这些数据,他们成功地组装了两个白金标准的参考基因组,已被公开发布。在这里,他们提供了全套的原始数据,用于生成这两个参考基因组组件。这些数据集可以用来测试新的方案,以更好的进行基因组组装和注释,有助于发现基因组结构、功能和进化的新见解,并有助于为一般生物研究提供必要的支持。
(生物通:王英)
生物通推荐原文摘要:
Building two indica rice reference genomes with pacBio long-read and Illumina paired-end sequencing data
Abstract:Over the past 30 years, we have performed many fundamental studies on two Oryza sativa subsp. indica varieties, Zhenshan 97 (ZS97) and Minghui 63 (MH63). To improve the resolution of many of these investigations, we generated two reference-quality reference genome assemblies using the most advanced sequencing technologies. Using pacBio SMRT technology, we produced over 108 (ZS97) and 174 (MH63) Gb of raw sequence data from 166 (ZS97) and 209 (MH63) pools of BAC clones, and generated ~97 (ZS97) and ~74 (MH63) Gb of paired-end whole-genome shotgun (WGS) sequence data with Illumina sequencing technology. With these data, we successfully assembled two platinum standard reference genomes that have been publicly released. Here we provide the full sets of raw data used to generate these two reference genome assemblies. These data sets can be used to test new programs for better genome assembly and annotation, aid in the discovery of new insights into genome structure, function, and evolution, and help to provide essential support to biological research in general.