费城儿童医院(CHOp)的研究人员开发了一种新工具,帮助研究人员解释癌症体细胞突变的临床意义。这款名为CancerVar的工具整合了机器学习框架,不仅可以识别体细胞癌症突变,还可以解释这些突变在癌症诊断、预后和靶向性方面的潜在意义。今天,《Science Advances》杂志发表了一篇描述“癌症基因”的论文。

CHOp病理学和实验医学教授、论文资深作者Kai Wang博士说:“CancerVar不会在临床环境中取代人类的解释,但它将大大减少人类评审人员在精确肿瘤学实践中通过测序和起草临床报告对识别出的变异进行分类的手工工作。CancerVar详细记录并协调了各种类型的临床证据,包括药物信息、出版物和体细胞突变途径。通过提供标准化、可复制和精确的输出来解释体细胞突变,CancerVar可以帮助研究人员和临床医生优先考虑关注的突变。”

“体细胞变异的分类和解释是肿瘤基因组分析中最耗时的步骤,”病理学和实验医学教授、癌症基因组诊断主任、论文合著者Marilyn M.Li医学博士说。“CancerVar提供了一个强大的工具,可以自动执行这两个关键步骤。该工具的临床实施将显著提高测试周期和性能一致性,使所有儿科癌症患者都能更有效地负担测试费用。”

新一代测序(NGS)和精准医学的发展已经导致了数以百万计的体细胞癌症变异的识别。为了更好地了解这些突变是否与疾病的临床过程有关或影响,研究人员建立了几个数据库,对这些变异进行分类。然而,这些数据库没有提供体细胞变异的标准化解释,因此在2017年,分子病理学协会(AMp)、美国临床肿瘤学会(ASCO)和美国病理学家学院(CAp)联合提出了体细胞变异解释、报告和评分的标准和指南。

然而,即使有了这些指南,AMp/ASCO/CAp分类方案也没有明确规定如何实施这些标准,因此不同的知识库提供了不同的结果。为了解决这个问题,CHOp的研究人员,包括CHOp数据科学家和论文的合著者Yunyun Zhou博士,开发了CancerVar,一种改进的体变体解释工具,使用命令行软件python和一个网络服务器。通过一个用户友好的网络服务器,CancerVar包含了从现有研究和数据库中挖掘的1911个癌症普查基因中1300万个体细胞癌症变异的临床证据。

除了包括数以百万计的体细胞突变(无论是否具有已知意义),该工具还使用深度学习来改善这些突变的临床解释。用户可以使用染色体位置或蛋白质变化等信息查询变异的临床解释,并基于先验知识或其他用户指定的标准,交互式微调特定评分特征的权重。CancerVar web服务器生成自动的描述性解释,例如突变是否与诊断、预后或正在进行的临床试验有关。

“这个工具展示了我们如何使用计算工具来自动化人类生成的指导方针,以及机器学习如何指导决策制定,”Wang说。“未来的研究也应该探索将这个框架应用到病理学的其他领域。”



由费城儿童医院提供