青鳉(Oryzias latipes)是一种重要的脊椎动物模型,已经在遗传学,发育生物学以及环境科学等领域广泛应用。目前,青鳉已有高质量的基因组序列,以及大量可用的遗传学技术手段。然而,目前的青鳉基因组注释主要是基于生物信息学预测和短读长的转录组测序数据,仍然存在很多问题。低质量的基因组注释是利用青鳉作为模式动物进行组学和系统生物学研究的重要障碍。

中国科学院遗传与发育生物学研究所屠强团队和日本国家基础生物学研究所的Kiyoshi Naruse 教授团队合作,用pacBio转录组测序,Illumina转录组测序以及ATAC-seq这三种组学实验手段获得了青鳉胚胎发育过程中的转录及调控动态图谱。整合这些数据,研究者获得了准确全面的基因注释信息,其中包括17,000个新转录本、1600个转录因子、1100个长链非编码RNA和150,000个候选顺式调控元件。

此外,利用时间序列数据提供的基因表达动态图谱,研究者发现了一批在胚胎发育中出现转录本异构体转换的基因;利用基因调控动态图谱,研究者发现了顺式调控元件之间有同步、抑制、增强子转换、提前开放四种调控逻辑,而在反式调控元件方面,研究者发现了一批早期胚胎发育中的先锋转录因子。

最后,团队还开发了青鳉组学数据门户网站(http://tulab.genetics.ac.cn/medaka_omics/),提供该研究获得的以及已发表的相关数据供研究人员使用。该网站提供了上百组学数据,来自于多种组学技术以及多个胚胎发育阶段或成体组织等样品,还提供了大量功能注释信息和表达定量数据。

该研究首次获得了全面的青鳉胚胎发育多组学数据集,相关门户网站将会成为青鳉领域的基础设施和日常参考工具。另外,研究者将这三种组学技术组合命名为“ENCODE最小工具箱”,对于很多缺乏组学数据的物种来说,这个技术组合应该作为首选的组学分析工具,对相关领域都有重要参考意义。

该成果于2020年6月23日正式发表于 Genome Research 杂志(DOI:10.1101/gr.258871.119),文章标题为“Dynamic Transcriptional and Chromatin Accessibility Landscape of Medaka Embryogenesis”。屠强研究组博士研究生李莹姝和刘勇杰为该论文的共同第一作者,屠强研究员和Kiyoshi Naruse教授为该论文的共同通讯作者。该研究得到国家自然基金和中科院先导项目的资助。