大多数新出现的人类传染病(如 )都是人畜共患的——由源自其他动物物种的病毒引起。及早识别高风险病毒可以改善研究和监测重点。英国格拉斯哥大学的 Nardus Mollentze、Simon Babayan 和 Daniel Streicker 于9 月 28日在PLOS Biology上发表的一项研究表明,使用病毒基因组的机器学习(一种人工智能)可以预测任何动物感染的可能性。考虑到生物学相关的暴露,病毒会感染人类。
在出现之前识别人畜共患病是一项重大挑战,因为在估计的 167 万种动物病毒中,只有一小部分能够感染人类。为了使用病毒基因组序列开发机器学习模型,研究人员首先编译了来自 36 个科的 861 个病毒物种的数据集。然后他们建立了机器学习模型,该模型根据病毒基因组的模式分配人类感染的概率。然后,作者应用表现最佳的模型来分析从一系列物种中采样的其他病毒基因组的预测人畜共患病潜力的模式。
研究人员发现,病毒基因组可能具有独立于病毒分类关系的可概括特征,并且可能使病毒预先适应以感染人类。他们能够开发出能够使用病毒基因组识别候选人畜共患病的机器学习模型。这些模型有局限性,因为计算机模型只是识别可能感染人类的人畜共患病毒的初步步骤。
在进行重大的额外研究投资之前,模型标记的病毒将需要进行验证性实验室测试。此外,虽然这些模型预测病毒是否能够感染人类,但感染能力只是更广泛的人畜共患病风险的一部分,这也受到病毒对人类的毒力、人与人之间传播的能力以及生态条件的影响在人体暴露时。
这组作者说,“我们的研究结果表明,病毒的人畜共患病潜力可以从它们的基因组序列中推断出惊人的程度。通过突出显示最有可能成为人畜共患的病毒,基于基因组的排名可以进一步进行生态和病毒学表征。更有效地瞄准。”
这些发现为我们可以使用人工智能技术从病毒的基因序列中提取的大量信息添加了一个关键部分。基因组序列通常是我们掌握的关于新发现病毒的第一个,通常也是唯一的信息,我们可以从中提取的信息越多,我们就能越早确定病毒的起源及其可能带来的人畜共患风险。随着更多病毒被表征,我们的机器学习模型在识别稀有病毒方面将变得更加有效,这些病毒应该被密切监测并优先用于抢先疫苗开发。”