机器学习解决了有机晶体核磁共振谱中的谁是谁的问题
固态核磁共振 (NMR) 光谱——一种测量暴露在强磁场中的无线电波的一些原子核发射的频率的技术——可用于确定化学和 3D 结构以及分子动力学和材料。
然而,分析中一个必要的初始步骤是所谓的化学位移分配。这涉及将 NMR 光谱中的每个峰分配给所研究的分子或材料中的给定原子。这可能是一项特别复杂的任务。通过实验分配化学位移可能具有挑战性,并且通常需要耗时的多维相关实验。通过与实验化学位移数据库的统计分析进行比较分配将是一种替代解决方案,但没有这样的分子固体数据库。
包括 EPFL 教授 Lyndon Emsley、磁共振实验室负责人、计算科学与建模实验室负责人 Michele Ceriotti和博士生 Manuel Cordova在内的一组研究人员决定通过开发一种分配 有机物核磁共振谱的方法来解决这个问题。直接从其 2D 化学结构中概率性地推断出晶体。
他们首先通过将剑桥结构数据库 (CSD)(一个包含超过 200,000 个三维有机结构的数据库)与ShiftML(一种他们之前共同开发的机器学习算法)相结合,创建了自己的有机固体化学位移数据库。用于直接从分子固体结构预测化学位移。
ShiftML 最初在 2018 年的 Nature Communications 论文中描述,使用 DFT 计算进行训练,但随后可以对新结构进行准确预测,而无需执行额外的量子计算。虽然达到了 DFT 精度,但该方法可以在几秒钟内计算出具有约 100 个原子的结构的化学位移,与当前的 DFT 化学位移计算相比,计算成本降低了 10,000 倍。该方法的准确性不取决于所检查结构的大小,并且预测时间与原子数呈线性关系。这为在以前不可行的情况下计算化学位移奠定了基础。