Nature Biotechnology:了解基因组在单个细胞中组织方式的新工具
在单个人类细胞的微观边界内,蛋白质和DNA束的复杂折叠和排列决定了一个人的命运:哪些基因被表达,哪些基因被抑制,以及——重要的是——它们是保持健康还是患上疾病。
尽管这些基因束对人类健康有潜在的影响,但科学家对基因组在细胞核中如何折叠以及它如何影响基因表达的方式知之甚少。但卡内基梅隆大学计算生物学系的一个团队开发的一种新算法,为以前所未有的分辨率说明这一过程提供了一个强大的工具。
该算法名为Higashi,基于超图表示学习——这种机器学习形式可以在应用程序中推荐音乐,并进行3D物体识别。
计算机科学学院的博士生张若驰(Ruochi Zhang)和博士生周天明(Tianming Zhou)以及计算生物学雷和斯蒂芬妮莱恩(Ray and Stephanie Lane)教授马建(Jian Ma)领导了这个项目。张博士以一种传统的日本甜品命名Higashi,延续了他开发的其他算法开始的传统。
“他带着热情去研究,但有时也带着幽默感,”马教授说。
他们的研究发表在《自然-生物技术》杂志上,作为一个多机构研究中心的一部分,该中心寻求更好地了解细胞核的三维结构,以及这种结构的变化如何影响健康和疾病中的细胞功能。这个1000万美元的研究中心由美国国立卫生研究院资助,由CMU领导,马是它的首席研究员。
该算法是第一个在超图上使用复杂神经网络的工具,以提供单细胞基因组组织的高清分析。普通图将两个顶点连接到一个相交点(即一条边)上,而超图将多个顶点连接到一条边上。
染色体是由一种叫做染色质的dna - rna -蛋白质复合物组成的,它可以折叠并自行排列以适应细胞核。这一过程通过使每个成分的功能成分更紧密地结合在一起,从而激活或抑制特定的遗传特征,从而影响基因的表达方式。
Higashi算法与一种被称为单细胞Hi-C的新兴技术一起工作,这种技术可以创建单个细胞中同时发生的染色质相互作用的快照。Higashi提供了一个更详细的分析染色质的组织在单一细胞的复杂组织和生物过程,以及它的相互作用如何在细胞之间变化。通过这种分析,科学家们可以看到细胞间染色质折叠和组织的详细变化,包括那些细微的,但对确定健康影响很重要的变化。
“基因组组织的可变性对基因表达和细胞状态有很强的暗示作用”。
Higashi算法还允许科学家同时分析其他与单细胞Hi-C共同分析的基因组信号。最终,这一特性将使Higashi的能力得以扩展,这是及时的,考虑到单细胞数据的预期增长,Ma预计在未来几年通过NIH 4D Nucleome项目,他的中心所属的项目。这种数据流将为设计更多算法创造更多机会,这些算法将促进对人类基因组在细胞内如何组织及其在健康和疾病中的功能的科学理解。
“这是一个快速发展的领域,”马教授说。“实验技术正在迅速发展,计算技术也在发展。”
原文标题:
Multiscale and integrative single-cell Hi-C analysis with Higashi