为了庆祝《Nature Reviews Genetics》成立20周年,杂志邀请了12位学术界的领先专家,请他们谈谈遗传学和基因组学领域面临的主要机遇和挑战。他们总结了目前的发展状况,并强调了未来几年需要完成哪些工作,以便让每个人都能感受到科技进步的好处。

Barbara Treutlein:单细胞的空间多组学研究

苏黎世联邦理工学院,发育生物学副教授

早在2009年,科学家就完成了第一个单细胞转录组的测序。Treutlein指出,自从这一里程碑以来,人们已对各种生物和组织的数百万个细胞的转录组进行了测序和分析。这些细胞状态的图谱正在彻底改变生命科学。相关的技术和算法已经成熟并普及。

当然,转录组并不够,人们还开发出方案来测定单细胞的染色质开放性、组蛋白修饰、蛋白质丰度、细胞谱系以及其他特征。许多研究需要对单细胞进行解离,在此过程中破坏了空间背景。目前人们正在不断改进方法,以便原位测定基因组特征,以及通过计算将基因组特征映射到空间背景中。

Treutlein认为,细胞通量仍然是一个挑战。利用基于解离的单细胞测序方案,全世界许多实验室能够在每次实验中分析成千上万个细胞。然而,在某些场景下,实验需要分析数百万个细胞,比如扰动筛选。如何利用当前的测序技术将全转录组测序扩展到数百万个细胞,目前还不清楚。

在Treutlein看来,单细胞研究的“最终目标是直接测定同一细胞中尽可能多的特征(例如RNA、谱系、染色质、蛋白和DNA甲基化),理想情况下还具有空间分辨率”。此外,将遗传学和药理学扰动筛选与单细胞多组学方法相结合,将有助于了解每种细胞的细胞状态和调控网络。

“新一代的单细胞基因组学方法和人类类器官技术将为人类疾病新型疗法的开发提供前所未有的机会,”Treutlein在文中写道。

Alexander Meissner:揭开表观基因组的多个层次

马克斯•普朗克分子遗传学研究所,主任

Meissner实验室一直在从事发育和疾病生物学研究,重点放在表观遗传调控。在过去十年中,DNA测序占据主导地位,并促进了各种调控图谱的指数级增长。对于转录组、组蛋白修饰、转录因子覆盖和DNA可接近性,目前已经收集到大量的全基因组数据集。此外,单细胞转录组和表观基因组的数据也正以前所未有的速度增长。

“我们在过去十年已经看到了充分整合和多层次的表观基因组分析,这些分析带来了相当全面的表观基因组景观图,”Meissner谈道。他认为,现在需要围绕数据访问和共享进行创新。同时,关于这些表观遗传修饰的分子协调和发育功能,目前还有许多重要的问题有待回答。

在他看来,最近的一些技术突破将在未来几年推动表观遗传学发展。具体包括基因组编辑工具CRISpR/Cas9系统,可以实现碱基编辑、表观基因组编辑和各种基因组操作。同时,快速的内源蛋白降解系统也被开发出来。而且,成像技术以及细胞和分子生物学技术也有了重大改进,细胞培养从2D演变为3D,出现了类器官培养模型。

另一个重大变化是人们重新认识到无膜细胞器(membraneless organelles)是细胞构成的广泛机制。人们对聚集体如何形成以及如何发挥功能(包括转录调控)有了新的认识。再加上人们已知的组蛋白对DNA的作用以及许多表观遗传调控因子也包含内在无序的区域,Meissner认为这些物理性质将对我们了解染色体产生重大影响。

最后,他认为这项研究越来越依赖多学科技能,而数学、物理学、化学和计算机科学将在生物学中发挥越来越重要的作用。这需要在培训中重新进行思考,以实现我们的目标。如今距离5-甲基胞嘧啶的首次发现已有95年,在百年纪念到来之际,人们有望揭开表观基因组的多个层次,让我们充分了解它们的运行规则,从而实现更加精准的治疗干预。

Howard Chang:关注长链非编码RNA

斯坦福大学,霍华德休斯医学研究所,研究员

长链非编码RNA(lncRNA)是许多真核生物基因组的主要转录产物。尽管之前的研究揭示了多个lncRNA的各种机制和疾病意义,但大多数lncRNA仍然是神秘的,Chang认为根本的挑战是我们缺乏将lncRNA序列转化为功能的知识。在他看来,下一个十年将是从“读取”lncRNA到“书写”lncRNA的模式转变。

目前估计人类基因组编码了近6万个lncRNA,长度从数百个碱基到数万个碱基不等,这些碱基显然无法通过编码蛋白质发挥作用。过去十年的研究发现,许多lncRNA可以充当向导、支架或诱饵,以控制特定的染色质修饰酶或转录因子。如今,世界各地的实验室正在研究lncRNA在各个系统中的作用,从控制开花时间到人类遗传疾病。

不过,Chang指出,过去二十年以来,“读取”lncRNA一直是主要的实验策略。一个颇具潜力的方向是从“读取”lncRNA转变为“书写”lncRNA。在系统解析RNA序列和二级结构后,他们认为lncRNA中的信息类似于广告牌上的信息,关键词和标语不断重复。小单位的RNA结构在lncRNA当中不断重复,它们可以出现在不同的位置,或按照不同的顺序,但不会影响其含义。

研究人员将lncRNA分解为基本的“词”,这些词由关键的重复结构组成,大小仅为原始lncRNA的十分之一,但仍然可在体内控制染色质的状态。如今,人们终于能够成功合成lncRNA。他们将RNA结构添加到精心选择的RNA模板上,能够部分拯救生理性lncRNA的基因敲除,或让RNA靶定细胞内的特定位置。

Núria López-Bigas:实现FAIR基因组学,以追踪肿瘤发生

巴塞罗那科学技术学院,生物医学研究所教授

López-Bigas认为,对于基因组学的飞速发展,癌症研究也许是受益最大的领域之一。在不到二十年的时间内,患者肿瘤的癌症基因组、表观基因组和转录组数据都取得了令人难以置信的增长。作为癌症研究人员,他的梦想是全面了解肿瘤发生所经的途径。

癌症基因组学的第一个明确目标是对不同组织中与肿瘤发生有关的所有基因进行分类。尽管这是一项艰巨的任务,但实际上是可行的。通过分析肿瘤内基因的突变模式,人们可以鉴定出那些与预期值有显著差异的基因。为了建立肿瘤基因目录,他认为不仅需要扩展基因组测序,更重要的是产生的数据必须FAIR(可检索、可访问、可互操作以及可重复使用)。

当然这只是第一步,距离人们了解基因突变如何驱动肿瘤发生以及在何种条件下驱动的最终目标仍相去甚远。López-Bigas建议将癌症发展看成达尔文式的进化过程。如同任何达尔文过程一样,它的两个关键特征是变异和选择。“多亏了过去十五年的癌症基因组学研究,我们现在可以更好地理解不同组织中体细胞遗传变异的来源,”他说。

此外,他还提到,几乎所有的肿瘤都存在驱动基因突变,这意味着驱动事件是必要的。但是,它们又不足以导致肿瘤发生。那么,肿瘤发生的其他触发因素有哪些?吸烟和化疗又对细胞做了什么?表观遗传学修饰和进化上的瓶颈也许是答案的一部分。未来,他希望能够弄清组织中导致肿瘤发生及其他疾病的变异和选择的每一步过程。

Eran Segal:将基因组学整合到医学中

以色列魏茨曼科学研究所,计算科学和应用数学系教授

Segal谈到,基因组学的过去二十年非同寻常。利用高通量测序技术,人们建立了整个生物界的基因组、功能性DNA元件和非编码RNA的目录。然而,基因组学尚未兑现对日常生活产生影响的承诺。在全球暴发COVID-19疫情时,人们能够快速地对新型冠状病毒的基因组进行测序,但却不知道为什么有些感染者会出现严重的症状。

他认为,我们应该利用基因组学来解决一些悬而未决的大问题,例如是什么导致我们的表型、疾病易感性和药物反应上有差异?遗传、表观遗传、微生物组和环境因素的相对贡献是什么?最终,我们应利用基因组学来产生可行动的个性化见解,从而改善健康状况。

他建议以多组学方法直接分析大型队列。随着技术的进步和成本的下降,人们能够获得更深度的多组学图谱,包括转录组、蛋白质组、甲基化组、微生物组、免疫系统和代谢组。在多个时间点获得同一个体的这些数据,能够揭示每种疾病在哪个组学层面受到扰动,并确定分子标志物与疾病之间的关联。

Segal认为,人们面临的挑战是确定哪些关联是存在因果关系的。解决这个问题的一种方法是明智地选择关联的性质和类型。例如,在处理微生物组数据时,我们可从物种组成的分析转向细菌基因SNp水平的分析。另一种方法是通过纵向测量和时间间隔来模拟目标试验。最终需要在随机临床试验中对生物标志物进行测试,以建立因果关系并评估效果。

Jin-Soo Kim:CRISpR基因组编辑进入临床

韩国基础科学研究所,基因组改造中心主任

如今,人们已经开发出三种工具用于基因组编辑,包括锌指核酸酶、TALEN和CRISpR系统。这些工具已进入临床,Kim表示,在接下来的几年,我们将看到这些工具是否能够安全有效地治疗多种疾病的患者,包括HIV感染、白血病和遗传性失明,这预示着一个新时代的到来。

他认为,影响可编程核酸酶进入临床的关键问题包括其导入方式、特异性、on-target活性和免疫原性。首先,考虑到这些核酸酶的大小,将编码核酸酶的基因或Cas9核糖核蛋白直接导入患者体内颇有挑战性。离体导入比活体导入更有效,但仅限于血液或骨髓细胞。这些细胞可轻松收集,在体外编辑并回输到患者体内。

其次,可编程的核酸酶可能导致不想要的on-target和off-target突变,这也许会导致肿瘤发生。人们已经开发出一些方法,以无偏倚的方式鉴定全基因组的CRISpR脱靶位点。不过,由于测序技术的固有错误率,验证突变频率低于0.1%的位点仍然是一项挑战。Kim认为需要了解on-target活性异常背后的机制,并减少此类事件的发生。

最后一点,Cas9及其他可编程的核酸酶可能具有免疫原性,也许会引起免疫反应。在这方面,他认为临床试验可将Cas9核糖核蛋白导入T细胞,或在眼睛内进行体内基因编辑。一些新颖的Cas9直系同源物可避免某些免疫反应,从而实现其他组织或器官的基因组编辑。

Kim还提到,base editors和prime editors也非常适合生殖系编辑和子宫内编辑,但是应在充分考虑道德、法律和社会问题的情况下谨慎行事。他希望这些工具在未来几年得到进一步的开发,并在科研和医学领域得到更广泛的应用。(生物通 薄荷)

延伸阅读:十二位专家畅谈基因组学的未来(上)

原文检索

McGuire, A.L., Gabriel, S., Tishkoff, S.A. et al. The road ahead in genetics and genomics. Nat Rev Genet 21, 581–596 (2020). https://doi.org/10.1038/s41576-020-0272-6