当研究人员首次将CRISpR作为细菌、植物、动物和人类细胞的基因编辑技术进行设计时,它最终成为一场诺贝尔奖得主的革命。这项技术的潜力巨大,从治疗遗传疾病到应用于农业和工业生物技术,但也有挑战。

其中一个挑战是选择一个所谓的gRNA分子,该分子的设计应能将Cas9蛋白引导到DNA中正确的位置,在那里它将对基因编辑进行切割。

“通常,有多种可能的gRNA,它们的效率并不都相同。因此,面临的挑战是选择高效率工作的少数,这正是我们的新方法所做的,”奥胡斯大学生物医学系副教授雍伦洛说。“通过将我们自己的数据与公开的数据相结合,包括关于gRNA、DNA和CRISpR-Cas9蛋白之间的分子相互作用的知识,我们成功地开发了一种更好的方法,”Jan Gorodkin说,哥本哈根大学兽医与动物科学系教授,

<强>数据,深入学习分子相互作用 Jan Gorodkin与Giulia Corsi研究小组的研究小组与雍伦洛的研究小组合作,以取得新的成果。这项研究的实验部分由Luo的小组进行,Gorodkin的小组率先进行了计算机模拟。

“在我们的研究中,我们量化了超过10000个不同位点的gRNA分子的效率。这项工作是用一种大规模、高通量的基于文库的方法完成的,这在传统的方法中是不可能的,”罗永伦说。

研究人员从数据生成的角度出发,一次在一个细胞中有一个病毒表达gRNA和一个合成的靶点。合成的靶位点与基因组中相应的靶位点具有完全相同的DNA序列。因此,这些合成目标位点被用作所谓的替代目标位点,以捕获CRISpR-Cas9的编辑效率。与BGI研究院Lars Bolund再生医学研究所和哈佛医学院的同事一起,他们为超过10000个gRNAs产生了高质量的CRISpR-Cas9活性。

利用已知效率从低到高的gRNAs数据集,研究人员能够建立一个模型来预测gRNAs的效率,这是以前从未见过的。

“为了训练算法变得精确,必须有一个大的数据集。利用我们的病毒库,我们获得的数据构成了训练我们的深度学习算法以预测基因编辑的gRNAs效率的完美起点。我们的新方法比目前可用的其他方法更精确

Journal Reference:

Xi Xiang, Giulia I. Corsi, Christian Anthon, Kunli Qu, Xiaoguang pan, Xue Liang, peng Han, Zhanying Dong, Lijun Liu, Jiayan Zhong, Tao Ma, Jinbao Wang, Xiuqing Zhang, Hui Jiang, Fengping Xu, Xin Liu, Xun Xu, Jian Wang, Huanming Yang, Lars Bolund, George M. Church, Lin Lin, Jan Gorodkin, Yonglun Luo. Enhancing CRISpR-Cas9 gRNA efficiency prediction by data integration and deep learning. Nature Communications, 2021; 12 (1) DOI: 10.1038/s41467-021-23576-0