计算机科学家开发了一种高精度识别疾病生物标志物的方法
滑铁卢大学(University of Waterloo)切里顿计算机科学学院(Cheriton School of Computer Science)的专家们创建了一个深度神经网络,可以实现对数据集中98%的肽特征的检测。这意味着科学家和医疗从业人员有更大的机会通过组织样本分析发现可能的疾病。
通过分析生物样品的蛋白质结构来检测疾病已有多种现有技术。计算机程序在这一过程中扮演着越来越重要的角色,通过检查这些测试中产生的大量数据来确定疾病的特定标记。
“但是现有的程序往往是不准确的,或者可能会受到潜在功能上的人为错误的限制,”Cheriton计算机科学学院的博士研究员Fatema Tuz Zohora说。
“我们在研究中所做的是创建一个深度神经网络,实现对数据集中98%的肽特征的检测。我们正在努力使疾病检测更准确,为医疗从业者提供最好的工具。”
肽是组成人体组织蛋白质的氨基酸链。正是这些小链往往显示出疾病的特定标志。有了更好的检测手段,就有可能更早、更准确地发现疾病。
Zohora的团队将他们新的深度学习网络称为pointIso。这是一种机器学习或人工智能的形式,它是在生物样本现有序列的巨大数据库上训练的。
“其他检测疾病生物标志物的方法通常有很多参数,必须由现场专家手工设置,”Zohora说。“但我们的深层神经网络会自己学习参数,这更准确,使疾病生物标志物的发现接近自动化。”
这个新项目的独特之处在于,它不是只寻找一种疾病,而是识别与心脏病、癌症甚至COVID-19等一系列疾病相关的生物标志物。
“它适用于任何一种疾病生物标志物的发现,”Zohora说。“因为它本质上是一种模式识别模型,它可以用于在大量数据中检测任何小物体。医学和科学有很多应用;看到这项研究带来的可能性以及它如何帮助人们,这是令人兴奋的。”
Journal Reference:
Fatema Tuz Zohora, M. Ziaur Rahman, Ngoc Hieu Tran, Lei Xin, Baozhen Shan, Ming Li. Deep neural network for detecting arbitrary precision peptide features through attention based segmentation. Scientific Reports, 2021; 11 (1) DOI: 10.1038/s41598-021-97669-7