蛋白质糖基化修饰的精准分析对于疾病机制研究、生物标志物发现,以及药物和疫苗开发至关重要。完整糖肽分析能获得特定糖基化位点与糖链的对应关系信息,是现代糖蛋白质组学研究中十分重要而极具挑战性的组成部分。目前,糖肽分析最常用的质谱采集模式是数据依赖性采集(DDA),存在母离子选择随机性的问题,其结果中存在较多的缺失值。近年来出现的数据非依赖性采集(DIA)模式能弥补DDA的缺点,已开始初步应用于糖蛋白质组学领域。然而,现有的糖肽DIA分析方法缺乏可靠的质控,难以处理多种糖肽在隔离窗口中共碎裂的复杂情况。

2021年10月18日,与我院曹纬倩团队与复旦大学化学系乔亮团队课题组在Nature Communications在线发表了题为“GproDIA enables data-independent acquisition glycoproteomics with comprehensive statistical control”的研究论文。文章详细介绍了一种全新的完整糖肽DIA数据分析工具GproDIA。该工具将以肽段为中心DIA分析的概念扩展到完整糖肽分析,通过二维错误发现率(FDR)和糖型推断算法提供全面的统计质控,实现糖肽的精准鉴定和定量。

二维FDR算法首先为谱图库中目标糖肽生成肽段诱饵、糖链诱饵和糖肽双诱饵,从DIA数据中提取目标糖肽和三种类型诱饵的谱图信息并对肽段和糖链部分分别进行评分。然后采用双变量四组分混合模型拟合目标糖肽和诱饵的得分分布,由此估计每个目标糖肽匹配结果中肽段、糖链部分错误或两者都错误的概率(即局部FDR)和所报告全部结果的整体错误率(即全局FDR)。

对于复杂样品,糖肽的鉴定会受到隔离窗口中相同肽段序列上的其他糖型的潜在干扰。为此,研究人员进一步提出了一种糖型推断算法。该算法首先为DIA隔离窗口内的潜在糖型生成鉴定离子,从DIA数据中提取这些鉴定离子和目标糖肽母离子的谱图信息进行评分,然后采用贝叶斯层次模型将目标糖肽原先的得分同母离子和鉴定离子的得分加以整合,得到糖型的得分,从而对糖型的错误率进行质控。

研究人员将GproDIA在酵母和人血清N-糖肽样品的DIA数据上进行测试。结果表明,GproDIA在糖肽鉴定数、数据完整性,以及定量的准确性和精密度方面均优于现有基于DDA的方法。与现有的糖肽DIA分析方法相比,GproDIA不仅能排除肽段部分的错误鉴定结果,还能对糖链部分进行良好的质控,实现了更准确的糖肽鉴定。

作为迄今为止第一种为肽段和糖链部分都提供全面质控的DIA数据分析工具,GproDIA解决了DIA在完整糖肽分析中面临的一项重要难题,有望推广DIA在糖蛋白质组学领域的应用,促进蛋白质糖基化相关疾病机制和生物标志物的研究。

乔亮、曹纬倩合作团队的主要研究方向是蛋白质组学和糖蛋白质组学方法开发。此前,乔亮研究员和曹纬倩副研究员曾在Nature Communications分别发表研究论文报道基于深度学习预测谱图库的DIA分析工具DeepDIA(doi:10.1038/s41467-019-13866-z)和完整糖肽DDA数据搜索引擎鉴定技术pGlyco 2.0(doi:10.1038/s41467-017-00535-2)。本工作是他们在该研究领域合作取得的又一重要成果。

全文链接:

https://doi.org/10.1038/s41467-021-26246-3