今日最新上线的《自然》子刊《Nature Medicine》上,发表了一项激动人心的成果:利用机器学习和自然语言处理等人工智能(AI)技术,广州市妇女儿童医疗中心的夏慧敏教授和加州大学圣地亚哥分校(UCSD)张康教授领衔的一支研究团队,合作带来一款全新的AI诊断工具。这项工具和人类医生一样,当填写完患者口述和医生体查文本型病历之后,工具可直接阅读医疗病历,自动分析患者病情,智能给出推荐诊断。这是该团队在《细胞》杂志封面发表有关AI图像诊断的论文后,不到一年时间里,在AI技术实施应用于医疗方面取得的另一个重要里程碑。它标志AI模拟人类医生进行疾病诊断时代的到来。

近年来,AI在基于医学图像的诊断上一次次超越人类。在放射学、病理学、眼科学、皮肤病学等影像数据的识别和筛查上,以机器学习为基础的诊断工具表现抢眼。不过,这些应用对于迅猛发展的AI技术来说,还只是小试身手。真正的考验,在于AI能否像人类一样,读懂疾病信息,而不是仅仅分析图片。在这项研究中,科学家们成功实现了这一目标,挖掘出了AI在辅助医生诊断上的巨大潜力。而他们所关注的,是对多种儿科疾病的准确诊断。

对儿科疾病的诊断是医疗中的一大痛点。一方面,儿童的抵抗力较弱,容易罹患多种疾病。另一方面,一些儿科疾病威胁程度较大,需要尽快得到治疗。能够快速、准确地对儿科疾病进行诊断,不但可以减少患者们的等待时间,还可以让那些情况危急的儿童及时得到医疗诊治。

为了解决这一痛点,研究人员们首先训练AI理解海量电子病历中的临床特征数据,这包括了医生输入的大量文本报告。光是这一步,难度就比分析影像数据要大多了!电子病历中,包括个人史、体格检查、实验室检验结果、用药和手术等许多方面,维度远远高于图像。而且,电子病历数据中往往存在一些系统差错,以及有意或无意的输入错误,都会给数据分析带来噪音。因此,怎么从电子病历中挖掘数据,用机器学习方法来进行准确的模式识别,这是一个挑战。

为此,研究人员整合医学知识和数据建模,提出了一个数据挖掘框架,以深度学习技术为基础,开发了一套自然语言处理系统。

深度学习是机器学习的一个类别,使用多层神经网络进行推理,需要大量的训练数据来实现高精度。而这项研究的大量数据来自近60万名患儿、超过130万门诊人次的电子病历,让机器学习的技术提高有了极大保障。

尤其值得一提的是,针对电子病历中医生记录的诊断文本,研究人员建立了一套自然语言处理模型进行信息提取。在这一阶段,两个研究机构的医生和科学家通力合作,由高级主治医师和信息学研究人员组成的专家团队手动给电子病历上的6000多张图表进行注释,对模型进行训练和检验。高质量的数据输入成为这套系统的关键优势。

有了良好的训练为基础,接下来,研究团队采用逻辑回归分类器的机器学习方式,建立了一套AI分诊系统。这套分类系统模拟人类医生问诊的框架,把电子病历中提取到的临床特征按人体各大系统来逐级划分。

具体来看,这套系统首先会按呼吸系统疾病、胃肠道疾病、全身性疾病等几大系统分,然后在每一类下面做细分。举例来说,在最常见的呼吸系统疾病中,这个系统会先按上呼吸道和下呼吸道进行区分,再按喉炎、气管炎、支气管炎、肺炎进行细分。经过检验,在每一层级,由AI做出的初级诊断在精确度上都接近检查医师做出的初级诊断。例如在患儿群体中最常见的急性上呼吸道感染,模型对病例的诊断达到95%的准确率。

对于一些凶险的、有可能威胁生命的疾病(例如急性哮喘发作、细菌性脑膜炎等),算法也同样表现出了强大的诊断性能。这在临床应用中有非常重要的意义,因为有了AI快速分诊的辅助,就可以让医疗服务的有限资源用于最需要帮助的患者。

最后,要真正检验AI的实力,当然要让AI来和富有经验的人类医生比试一番了。研究人员拿出近12000份儿科患者的病历记录,并把20位“参赛”儿科医生按年资和临床经验高低分成5组,看看AI的成绩和哪一组医生接近。结果显示,AI模型的平均得分高于两组低年资医生,接近三组高年资医生。从这个结果来看,AI模型或许可以为年轻医生做诊治判断时助他们一臂之力了。

“我们的工作借助AI复制优质儿科医疗智力资源,增加优质儿科医疗资源供给,通过辅助赋能,提升儿科医疗行业效率和体验,并有望通过远程医疗和互联网医疗形成更大范围的示范推广,从而为基层儿科医生和年轻儿科医生提供辅助诊疗服务,为患儿家长提供智能自诊服务和权威的第二诊疗意见,避免误诊、漏诊造成的医疗风险。” 夏慧敏教授说。

“我们的工作为不久的将来提供一种准确快速廉价的儿科AI医生系统打下了坚实的基础。” 张康教授补充说。

我们再次祝贺夏慧敏教授和张康教授的研究团队,也期待人工智能的实施可以在不久的未来为广大患者提供准确高效的诊断,彻底改变看病难看病贵的现象。