足不出户的日子,大家是不是担心自己的实验进度、为文章发愁呢?不如转变下思路,好好整理手头上已有的数据,搭建数据库平台,不仅方便日后对数据进行管理、促进交流,说不定还可以顺便发文章呢!

2019年6月,由华中农业大学与华大基因合作搭建的玉米定制化多组学数据库——ZEAMAp(www.zeamap.com)正式上线。上线以来,ZEAMAp作为公开的数据平台,不仅为其他玉米研究者提供信息,同时也方便数据拥有者对数据进行管理。最重要的是,文章也发表啦!2020年1月,文章ZEAMAp, a comprehensive database adapted to the maize multi-omics era于bioRXiv上发布预印本。还不了解ZEAMAp的小伙伴们,特别是对玉米研究及定制化数据库搭建感兴趣的话,可以跟着科技君来一探究竟。

ZEAMAp整合了四种玉米自交系(SK、Mo17、B73、HuangZaoSi)及玉米的祖先大刍草的多组学数据,包含基因组组装、比较基因组、转录组、染色质开放性、染色质互作、变异、表型、代谢组学、遗传图谱、群体结构及进化等众多数据,并将它们有条理地划分为基因组学、变异、遗传学、群体、进化及表观遗传学六大模块。

基因组学模块

包含了基因组组装、基因表达模式以及比较基因组信息。

主要功能:

①通过JBrowse及WashU Epigenome Browser两个基因组浏览器实现基因组组装、基因表达、比较基因组信息的可视化(图1-A、图1-B)。

②布局Tripal synteny浏览器模块,以Circos图展示基因共线性分析结果(图1-B)。

③可显示基因在不同组织或样品的表达量情况,并根据基因的表达模式进行聚类(图1-C)。


图1 基因组学模块主要功能展示

(A:JBrowse展示相关信息;B: WashU Epigenome Browser展示相关信息 C:Circos图展现基因共线性分析结果;D:基因表达量及聚类结果展示)

变异模块

包含SV、InDel、SV及单倍体型信息。

主要功能:根据不同的染色体区域、变异类型、变异影响等进行SNp、InDel、SV等变异的分类检索(图2)。


图2 变异分类检索功能

遗传学模块

包含表型、基因表达模式信息,并通过GWAS及连锁分析得到相关基因座的信息。

主要功能:

①可交互的曼哈顿图、散点图结合,将GWAS分析结果可视化,并能链接到JBrowse查询感兴趣位点的相关信息(图3-A)。

②eQTL结果可视化,通过条件筛选,展示两eQTL位点之间的连锁关系的热图(图3-B)。

③连锁群包含的标记及QTL的展示(图3-C)。


图3 遗传学模块主要功能
(A:可交互的曼哈顿图及散点图展示GWAS结果;B:eQTL结果可视化;C:连锁群及其上标记展示)

群体模块

包含群体结构信息。

主要功能:可交互的pCA及STRUCTURE图展示群体结构分析结果。


图4 pCA(A)及STRUCTURE图(B)

进化模块

包含驯化选择信号的信息。

主要功能:展示驯化相关选择信号的强弱,并能链接到JBrowse查询感兴趣位点的相关信息。


图5 选择分析结果可视化展示

表观遗传学模块

包含染色质互作、染色质开放性、组蛋白修饰及DNA甲基化结果。

主要功能:通过WashU Epigenome Browser展示染色质互作、染色质开放性、组蛋白修饰及DNA甲基化等表观遗传学相关信息。


图6 染色质互作、染色质开放性及组蛋白修饰结果可视化

除了以上六个模块外,ZEAMAp还添加了许多扩展工具,如全站搜索引擎、BLAST、crispr浏览器、FTp数据下载器等,方便使用者对数据进行扩展挖掘。

多组学定制化数据库产品以您提供的研究数据为依托,根据您的需求,实现数据库的开发搭建。

数据库平台搭建 好处多多

①对数据进行系统性梳理,有助于您保存、管理、理解数据;

②利用数据库提供的扩展功能对多组学数据进行轻量级的联合挖掘,提高数据利用率;

③数据库作为公共平台,促进与其他研究者的交流分享;

④可作为独立成果发表文章。

偷偷告诉您,数据库搭建作为独立成果发表文章的不在少数哟!

表1 数据库发表文章(不完全统计)

定制化多组学数据库可根据您的需求搭建,逻辑形式不限,数据类型多样,扩展工具丰富。您只需要整理一下数据,其余的平台搭建工作交给我们,轻松实现数据到文章的转变。不要犹豫,现在马上把需求砸过来吧!