SARS-CoV-2 的进化威胁到疫苗和自然感染衍生的免疫以及治疗性抗体的功效。为了提高公共卫生准备,我们试图预测 SARS-CoV-2 中现有的哪些氨基酸突变可能会导致未来的关注变体。我们测试了包括流行病学、进化、免疫学和基于神经网络的蛋白质序列建模在内的特征的预测价值,并确定了 SARS-CoV-2 大流行内进化的主要生物学驱动因素。我们发现证据表明,ACE2 介导的传播性和对群体水平宿主免疫的抵抗力随着时间的推移作为 SARS-CoV-2 进化的主要驱动因素而起起落落。我们追溯性地确定了将传播的高精度(接受者操作特征曲线下面积,AUROC=0.92-0.97)突变,在大流行的不同阶段最多提前四个月。该模型的行为与合理的因果结构一致,其中流行病学协变量结合了病毒适应性的不同和不断变化的驱动因素的影响。我们应用我们的模型来预测将在未来传播的突变,并描述这些突变如何影响治疗性抗体的结合。这些发现表明,可以预测可能出现在关注的新兴 SARS-CoV-2 变体中的驱动突变。我们针对 Omicron 验证了这一结果,显示出出现前其成分突变的预测分数升高,并且出现期间每日预测的分数快速增加。

介绍