从未被采集过的骨骼肌类型,现在有了单细胞转录图谱
生物学家一直在努力研究这一过程中涉及到的罕见和短暂的肌肉细胞,但康奈尔大学的工程师们已经揭开了这些难以捉摸的动力学的帷幕,推出了scMuscle,这是同类中最大的单细胞数据库之一。
11月12日,《Communications Biology》杂志发表了一篇关于这项工作的报告。共同资深作者是康奈尔大学的Ben Cosgrove和Iwijn De Vlaminck,他们都是工程学院生物医学工程的副教授。
单细胞RNA测序的最新进展使生物学家能够从单个组织样本中识别出数万个细胞,但由于肌肉干细胞只占这些细胞的不到1%,而且它们短暂的后代细胞更少,所以测序实验根本无法捕捉到肌肉再生的完整画面。
这是Cosgrove在发表2020年的细胞图谱时遇到的一个问题,其中包含3.5万个参与修复过程的单个细胞。但在这些细胞中,只有不到200个细胞被植入或融合了肌源性细胞——这种罕见的短暂状态测序很难记录。
“想象一下,如果你有一幅按数字涂色的画,但你只涂色了四分之一的数字,”Cosgrove说,他与Vlaminck和博士生David McKellar共同领导了scMuscle的开发。“我们自己无法收集足够的数据来描绘细胞成熟和专门化时这些微妙转变的整体图景。”
康奈尔大学的研究小组知道还有其他大型测序数据集正在开发中,每个数据集都有自己的数据。因此,他们使用先进的计算技术开始合并集合,以描绘出更全面的图景。他们将88个公开可用的数据集与他们自己的几个数据集结合起来,形成了scMuscle数据库,该数据库保存了在不同年龄和实验条件下涉及肌肉损伤的大约36.5万个细胞的转录组数据。
“我们把它比作与多位艺术家一起创作一幅马赛克。它组合成一幅更丰富、更复杂的画。现在,我们对参与骨骼肌修复的非常罕见的细胞类型有了全面的了解,但之前没有采集过这些细胞。”
scMuscle数据库提供了另一个单次测序实验无法产生的重要信息——空间数据,详细说明了细胞如何在组织中组织和相互作用。
“众所周知,在生物学中,你的邻居决定了你的身份,”Cosgrove说,“现在我们可以识别分子因子,它们是细胞类型之间唯一的交流,并在损伤区描述它们的空间模式。”
自从1月份软启动scMuscle数据库以来,世界各地的数百名研究人员访问了它,搜索诸如衰老过程中性别特异性基因表达模式、以及哪些基因表达特征定义了参与疾病过程的不同细胞类型等信息。
Cosgrove和研究小组报告的一项发现回答了一个长期存在的问题,即当干细胞专一于成熟肌肉组织时,有多少基因通过分化的后代表达。
Cosgrove说,结果表明,细胞确实在使基因表达特征多样化,并在开始分化时开启各种基因。然后,一旦它们开始融合,它们就遇到了这个瓶颈,它们的基因表达模式被锁定在适当的位置,受到了极大的限制。
Cosgrove说,scMuscle数据库将继续作为一个强大的工具,为生物学家和其他寻求肌肉再生中罕见细胞活动的新观点的人,并希望吸引资金,以帮助宿主和不断整合新的数据到它的领域发展。
David W. McKellar, Lauren D. Walter, Leo T. Song, Madhav Mantri, Michael F. Z. Wang, Iwijn De Vlaminck, Benjamin D. Cosgrove. Large-scale integration of single-cell transcriptomic data captures transitional progenitor states in mouse skeletal muscle regeneration. Communications Biology, 2021; 4 (1)