X

AI加入疫情研究一线!用深度学习算法寻找肺炎病毒宿主

该研究提出一种基于深度学习的病毒宿主预测方法,用于检测以DNA序列为输入的病毒能感染哪种宿主,并将其应用于武汉2019年新型冠状病毒(2019-nCoV)。

为了构建病毒宿主预测VHP模型,朱怀球团队使用了双路卷积神经网络(BiPathCNN),其中每个病毒序列分别由其碱基和密码子的一个热矩阵表示。

所谓双路卷积神经网络(BiPathCNN),即针对相同构造的卷积神经网络输入同样的数据集也会提取到不同特征的情况,为利用该差异挖掘图像的深层特征,提出一种双路卷积神经网络模型的图像分类算法。

考虑到输入序列长度的差异,该研究分别建立了两个BiPathCNN(BiPathCNN-A和BiPathCNN-B),分别用于预测100bp到400bp和400bp到800bp的病毒序列宿主。

除此之外,大多数报告的人类感染性冠状病毒的p值均为VHP法预测的最低值。2019-nCoV和其他人类冠状病毒的相似概率说明了2019-nCoV的高风险。

VHP方法以及算法的验证:

为了构建VHP模型,朱怀球团队使用了双路卷积神经网络(BiPathCNN),其中每个病毒序列分别由其碱基和密码子的一个热矩阵表示。

考虑到输入序列长度的差异,分别建立了两个BiPathCNN(BiPathCNN-A和BiPathCNN-B)用于预测100bp到400bp和400bp到800bp的病毒序列宿主。

用于训练和测试的数据集包括所有DNA病毒的基因组、所有RNA病毒的编码序列及其在GenBank中的宿主信息。为了开发新病毒潜在宿主类型预测的方法专家,使用2018年之前发布的病毒序列数据构建训练集,而使用2018年之后发布的病毒序列数据进行测试。

将病毒的宿主分为五类,包括植物、细菌、无脊椎动物、脊椎动物和人类。

本报告中预测了2019年nCoV感染人类的可能性,并暗示了2019年nCoV的风险。

报告也显示,VHP模型可以在公共卫生服务中发挥重要作用,为预防可能感染人类的新型病毒提供强有力的帮助,从而提供可靠的预测宿主和感染人类的潜力。