DNA元件百科全书(Encyclopedia of DNA Elements,ENCODE)项目是一项全球性的工作,旨在了解人类基因组的功能。随着最新阶段的完成,ENCODE项目报道了人类和小鼠基因组中数百万个候选DNA“开关”,这对于解释遗传密码,了解基因何时何地打开至关重要。同时这一项目还提供了新的可视化工具,帮助科研人员使用ENCODE的大型数据(https://www.youtube.com/watch?v = Y3V2thsJ1Wc)。

ENCODE 3最新结果发表在Nature杂志以及其它主要期刊上,这10多篇论文汇总了20多年来的重要成就,将有助于揭示遗传变异如何塑造人类健康和疾病的。

NHGRI主任,医学博士Eric Green表示:“ ENCODE 3的主要作用之一是开发能与更多的研究团体共享数千个ENCODE实验数据的技术方法,帮助扩大我们对基因组功能的理解。ENCODE 3搜索和可视化工具帮助促进了开放科学。”

填补重要的知识空白

为了评估不同DNA区域的潜在功能,ENCODE研究人员分析了通常与调节基因的开关相关的生化过程。这种生化分析方法是快速而全面地探索整个基因组的有效方法,有助于在DNA中定位“候选功能元件”的区域。研究人员根据这些生化特性预测功能元件的DNA区域,然后可以在进一步的实验中测试候选元件,鉴定和表征其在基因调控中的功能。

ENCODE项目负责人Elise Feingold博士说:“ENCODE面临的主要挑战是不同的基因和功能区域在不同的细胞类型中具有活性。这意味着我们需要测试大量多样的生物样品,建立基因组中候选功能元件的目录。”

目前科学家们在表征蛋白质编码基因方面已经取得了重大进展,这些基因仅占人类基因组的2%。研究人员对剩下的98%的基因组了解得很少,包括其中的哪些部分执行了什么功能。ENCODE可以帮助填补这一重要的知识空白。

人体由数万亿个细胞组成,具有数千种细胞。尽管所有这些细胞共享一组通用的DNA指令,但是不同的细胞类型(例如,心脏,肺和脑)通过使用不同的DNA编码信息来执行不同的功能。 DNA区域可作为开关来打开或关闭基因,调节基因活性的确切水平,帮助推动机体中不同细胞类型的形成,并控制其在健康和疾病中的功能。

潜在的调控因子

在最新完成的ENCODE第三阶段中,研究人员进行了近6,000次实验,包括人体实验4,834次,小鼠实验1,158次,希望能阐明基因及其各自基因组中潜在调控因子的细节。

ENCODE 3研究人员研究了胚胎小鼠组织的发育过程,分析在小鼠发育过程中发生的各种基因组和生化变化的时间表。小鼠由于与人类的基因组和生物学相似,可以帮助我们了解人类的生物学和疾病。

在人类和小鼠中进行的这些实验是在几种生物学背景下进行的。研究人员分析了DNA的化学修饰,与DNA结合的蛋白质和RNA如何相互作用以调节基因。 ENCODE 3的结果也有助于解释蛋白质编码区以外的DNA序列变异如何影响基因的表达,甚至是特定变异远距离影响基因。

UCONN Health遗传与基因组科学系教授兼主席Brenton Graveley博士说:“ENCODE 3中生成的数据极大地增进了我们对人类基因组的了解。”

“该项目为以前的数据类型(例如DNA结合蛋白和染色质标记),以及新的数据类型(例如长距离DNA相互作用和蛋白质-RNA相互作用)增加了极大的分辨率和清晰度。”

同时,ENCODE 3研究人员还创建了一种资源,详细介绍了不同种类的DNA区域及其对应的候选功能。这种名为SCREEN的工具帮助研究人员可视化支持解释数据。

非常有价值的资源

ENCODE项目始于2003年,是一项广泛协作研究工作,由世界各地的小组,包括500多名具有不同专业知识的科学家团队组成。 它得益于世界各地独立研究人员进行的数十年基因调控研究。ENCODE研究人员创建了社区资源,确保任何研究人员均可访问该项目的数据。目前使用ENCODE项目生成的数据的非ENCODE研究人员发表了2,000多种出版物。

Feingold博士说:“这表明该百科全书被广泛使用,这是我们一直以来的目标。” “这些出版物中有许多与人类疾病有关,证明了该资源对于将基本生物学知识与健康研究联系起来的价值。”

(生物通:万纹)

原文标题:

perspectives on ENCODE