AIDD - 基于多层图注意力神经网络的药物-靶点相互作用预测模型研究
Nature | 基于多层图注意力神经网络的药物-靶点相互作用预测模型研究
引言
在药物研发过程中,准确预测**药物与靶点的相互作用(DTI)**对于确定化合物潜在治疗应用十分重要。传统的实验方法验证DTI,虽然可靠,但花费较多且耗时较长。
虽然现有神经网络的方法在 DTI 预测方面取得了重大进展,但它们在整合多源信息或处理药物-靶点相互作用的异质性方面经常出现问题。为此,作者提出了多层图注意力神经网络 (MLGANN) ,该网络不仅可以捕获了药物和靶点之间的多层次交互信息,还通过一种新颖的多层注意力机制整合了不同的数据源。最终,作者的实验结果表面,这种方法可以更全面、更准确地预测 DTI。
方法:MLGANN模型设计
2.1 多层DTI网络
MLGANN框架构建了一个多层网络,能够将来自药物和靶点的多源信息整合到一个统一的多层网络中。不像传统模型那样分别处理药物和靶点的关系,MLGANN将多种数据源(如化学结构、药物-疾病关系、副作用等)融合在一个网络中,这使得模型既能够表示药物和靶点的直接交互作用,也能够捕捉它们内部的相似性。
- 多源矩阵构建:每种药物和靶点都与多个矩阵关联,这些矩阵代表不同的交互和关系类型,例如化学相似性、药物-疾病联系和靶点-疾病关联。
- 图卷积网络(GCN)层:MLGANN的GCN层用于跨越不同网络层的交互,学习网络中节点的隐藏表示。
- 自注意力机制:模型使用自注意力机制来整合多源数据,按数据的重要性进行加权,以优化预测结果。
图 1.该图说明了一个多路复用层药物-靶点相互作用 (DTI) 网络,该网络跨多个层集成了来自药物 (D) 和靶点 (T) 的多级信息。左侧显示了不同层次的药物关联(标记为 AD、1、AD、2、AD、3),代表药物 D1、D2、D3 和 D4 之间的各种关系。在右侧,靶点关联以相似的层(AT,1 和 AT,2)描绘,靶点为 T1、T2 和 T3。该图的中央部分显示了药物和靶点之间的相互作用,其中多层网络结构用于捕获不同信息层之间的复杂相互作用。这种多层方法通过考虑层内和层间交互来实现更全面的 DTI 预测
MLGANN模型从网络的多个层级中聚合相邻节点的信息。每层表示一种特定的相似性或交互关系,这使模型既能从直接相邻节点(如具有相似化学结构的药物)中学习,也能从跨层关系(如共享副作用的药物)中学习。这种层次化的聚合方式增强了模型捕捉复杂交互关系的能力,使其优于单层网络。在生成最终的节点嵌入向量时,MLGANN使用多层注意力池化来加权聚合各层的信息,根据每个数据源在网络中的相关性进行调整。最终输出是每种药物和靶点的精细化表示,供DTI预测使用。
性能对比与分析
表1. 作者的模型与数据集 DTI 上的基线的比较。每次测量的最高和第二高结果分别以粗体和斜体显示。使用单侧配对 t 检验,与第二高的绩效相比,最佳模型表明 Pvalue 水平有显著改善。、* 分别代表 1% 和 0.1% 的显著水平。
研究者基于DrugBank数据集进行对比实验,将MLGANN的表现与多种基线模型进行了比较,包括基于相似性、知识图谱和图神经网络(GNN)的模型。关键评价指标包括精度、召回率、F1得分、AUC(ROC曲线下面积)以及AUPR(精确率-召回率曲线下面积)。
- 预测精度提升:由于MLGANN有效地利用了多源数据,在AUC和精度等指标上取得了显著的提升。
- 消融实验:消融实验进一步验证了模型中各层的重要性,表明移除特定层(如药物-疾病相似性)会导致显著的性能下降。
- 鲁棒性测试:通过随机移除部分训练数据来测试模型的鲁棒性,结果表明MLGANN在不同数据量下仍保持较高性能,并且在训练数据减少时表现出最小的性能衰减。
MLGANN模型对比传统方法的优势
MLGANN模型在多层结构和自注意力机制的加持下展现了超越传统DTI预测方法的显著优势。
区别于仅依赖化学结构或蛋白质序列的模型,MLGANN可以通过整合药物和靶点的多种信息,构建更为全面的潜在相互作用图景,从而能够捕捉更多关键数据。与同质模型不同,MLGANN的多层结构保留了药物-靶点交互的多样性,为更准确的预测提供了保证。MLGANN的设计灵活,可以进一步扩展以融入更多的数据源,使其具有很强的适应性,便于未来在DTI预测中的应用和拓展。
局限性与未来方向
尽管MLGANN在DTI预测中取得了显著进展,但仍然存在一些局限:
- 数据依赖性:模型的精度依赖于数据源的质量和完整性,数据缺失或不一致可能导致预测效果下降。
- 复杂性与计算成本:多层结构虽然有效,但需要大量计算资源,在计算能力受限的情况下可能限制其应用。
未来的研究可以进一步整合更多样化的生物数据源(如基因组和表观遗传信息)以提高预测的准确性。此外,优化模型的效率并将其应用于真实药物再利用情境,将为其在制药研究中的实际应用奠定基础。
结论
MLGANN在DTI预测领域的创新性是可以将GCN和注意力机制结合在一个多层框架中。MLGANN通过整合多种药物和靶点信息,实现了更准确和稳健的DTI预测,为加速药物发现和再利用提供了巨大潜力。MLGANN在解决现有模型局限的同时,为计算药理学的进一步创新铺平了道路,有助于开发新的治疗策略。
参考资料:Lu, Q., Zhou, Z. & Wang, Q. Multi-layer graph attention neural networks for accurate drug-target interaction mapping. Sci Rep 14, 26119 (2024). https://doi.org/10.1038/s41598-024-75742-1