改进的RNA数据可视化方法可以更快地获得更大的图像
就像从针孔相机到宝丽来,对流行的生物信息学数据可视化方法的公式的重要数学更新将允许研究人员开发单细胞基因表达的快照,不仅快几倍,而且分辨率更高。发表于自然方法,耶鲁数学家的这项创新将把百万点单细胞RNA测序(scRNA-seq)数据集的渲染时间从三个多小时缩短到仅十五分钟。
科学家表示,现有的十年前方法,即分布式随机邻域嵌入(t-SNE),非常适合用于表示在单一细胞水平上收集的RNA测序数据中的模式,scRNA-seq数据,二维。“在这种情况下,t-SNE'通过它们表达的基因组织细胞,并用于发现新的细胞类型和细胞状态,”首席作者,耶鲁大学博士生导师George Linderman说。专攻应用数学的学生。
根据计算标准,t-SNE非常慢。因此,在应用t-SNE之前,研究人员经常对其scRNA-seq数据集进行“下采样” - 从初始样本中采集较小的样本。然而,下采样是一个糟糕的妥协,因为它使得t-SNE不太可能捕获稀有细胞群,这通常是研究人员最想要识别的。
30多年前,另一支耶鲁大学数学家团队开发了快速多极方法(FMM),这是一种革命性的数值技术,可加速计算n体问题中的远程力。本研究的研究人员认识到,FMM背后的原理也可以应用于非线性降维问题,如t-SNE和加速t-SNE,直到它获得新名称:FIt-SNE,或基于快速插值的t -SNE。
“使用我们的方法,研究人员不仅可以更快地分析单细胞RNA测序数据,而且还可以用来表征在t-SNE之前对数据进行二次采样时无法检测到的稀有细胞亚群,”Yuval Kluger说道。作者和耶鲁病理学教授。此外,该团队对其FIt-SNE结果使用热图式可视化,这使研究人员可以轻松地同时查看数百个基因在单个细胞水平上的表达模式。
研究人员表示,2019年t-SNE获得“FIt”的新年不会更好。2018年12月,“科学杂志”命名为逐个细胞跟踪胚胎发育 - 如果没有基于scRNA-seq数据的可视化 - 年度突破,则无法实现。研究人员表示,FIt-SNE将加速这一发育生物学领域以及神经科学和癌症研究领域的进一步工作,其中单细胞测序已成为绘制大脑和理解肿瘤的宝贵工具。