华中科大连发五篇文章:发布lncRNA、泛素修饰等多个重要数据库
近年来,随着“精准医学”计划的发布,如何有效整合海量的高异质性、高复杂性生物医学大数据成为生命科学和医学领域的重大命题和挑战。
近日,华中科技大学生命科学与技术学院的“健康大数据”团队陆续发表了5篇论文,公布了多个重要的数据库,这些成果同期刊发在1月4日的Nucleic Acids Research杂志上。
《Nucleic Acids Research》上发表的5篇论文中所构建的数据库界面
大数据时代特点是数据无处不在,我们身边处处都有大数据。健康大数据是随着近几年数字浪潮和信息现代化而出现的新名词,是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的健康数据的集合。
在最新研究中,围绕哺乳动物长非编码RNA(lncRNA)与遗传变异的关系,郭安源教授研究组在已有研究基础上开发了lncRNASNp2数据库,包括25万多条人类和小鼠lncRNA的约1100万个单核苷酸多态性数据,并整合了功能注释、癌症突变、转录表达、疾病相关信息、结构变异,以及miRNA-lncRNA相互作用等信息,该工作为研究lncRNA的功能和异构体提供了重要数据资源。
针对真核生物泛素及类泛素偶联修饰,薛宇教授课题组系统收录了148种真核生物中13万多个相关调控因子,构建iUUCD 2.0数据库并整合序列、癌症突变、单核苷酸多态性、调控元件、蛋白质相互作用、三级结构、疾病相关信息、药物和靶标、蛋白质翻译后修饰、DNA甲基化、蛋白质表达和蛋白质组信息,该工作对于进一步研究泛素及类泛素偶联的机制具有重要意义;
刘智教授和陈卫华教授两个课题组与德国著名生物信息学家peer Bork教授合作,系统审编和收集了18,608种噬菌体群与9245种微生物之间的26,572个两两相互作用关系,构建了微生物-噬菌体整合数据库MVp,该数据资源对于未来环境微生物组学研究具有重要的支撑作用。
“健康大数据”团队由郭安源、宁康、薛宇和陈卫华四位教授组成,2016年入选华中科技大学“学术前沿青年团队”,2017年在华中科技大学鄂州工业技术研究院筹建“生物医学信息超算中心”。
原文标题:
lncRNASNp2: an updated database of functional SNps and mutations in human and mouse lncRNAs
iUUCD 2.0: an update with rich annotations for ubiquitin and ubiquitin-like conjugationsMVp: a microbe–phage interaction database
Database Resources of the BIG Data Center in 2018
dbCoRC: a database of core transcriptional regulatory circuitries modeled by H3K27ac ChIp-seq signals》