当前位置: 首页 > article >正文

AIDD - 基于多层图注意力神经网络的药物-靶点相互作用预测模型研究

Nature | 基于多层图注意力神经网络的药物-靶点相互作用预测模型研究

引言

在药物研发过程中,准确预测**药物与靶点的相互作用(DTI)**对于确定化合物潜在治疗应用十分重要。传统的实验方法验证DTI,虽然可靠,但花费较多且耗时较长。

虽然现有神经网络的方法在 DTI 预测方面取得了重大进展,但它们在整合多源信息或处理药物-靶点相互作用的异质性方面经常出现问题。为此,作者提出了多层图注意力神经网络 (MLGANN) ,该网络不仅可以捕获了药物和靶点之间的多层次交互信息,还通过一种新颖的多层注意力机制整合了不同的数据源。最终,作者的实验结果表面,这种方法可以更全面、更准确地预测 DTI。

方法:MLGANN模型设计

2.1 多层DTI网络

MLGANN框架构建了一个多层网络,能够将来自药物和靶点的多源信息整合到一个统一的多层网络中。不像传统模型那样分别处理药物和靶点的关系,MLGANN将多种数据源(如化学结构、药物-疾病关系、副作用等)融合在一个网络中,这使得模型既能够表示药物和靶点的直接交互作用,也能够捕捉它们内部的相似性。

  1. 多源矩阵构建:每种药物和靶点都与多个矩阵关联,这些矩阵代表不同的交互和关系类型,例如化学相似性、药物-疾病联系和靶点-疾病关联。
  2. 图卷积网络(GCN)层:MLGANN的GCN层用于跨越不同网络层的交互,学习网络中节点的隐藏表示。
  3. 自注意力机制:模型使用自注意力机制来整合多源数据,按数据的重要性进行加权,以优化预测结果。

图片

图 1.该图说明了一个多路复用层药物-靶点相互作用 (DTI) 网络,该网络跨多个层集成了来自药物 (D) 和靶点 (T) 的多级信息。左侧显示了不同层次的药物关联(标记为 AD、1、AD、2、AD、3),代表药物 D1、D2、D3 和 D4 之间的各种关系。在右侧,靶点关联以相似的层(AT,1 和 AT,2)描绘,靶点为 T1、T2 和 T3。该图的中央部分显示了药物和靶点之间的相互作用,其中多层网络结构用于捕获不同信息层之间的复杂相互作用。这种多层方法通过考虑层内和层间交互来实现更全面的 DTI 预测

MLGANN模型从网络的多个层级中聚合相邻节点的信息。每层表示一种特定的相似性或交互关系,这使模型既能从直接相邻节点(如具有相似化学结构的药物)中学习,也能从跨层关系(如共享副作用的药物)中学习。这种层次化的聚合方式增强了模型捕捉复杂交互关系的能力,使其优于单层网络。在生成最终的节点嵌入向量时,MLGANN使用多层注意力池化来加权聚合各层的信息,根据每个数据源在网络中的相关性进行调整。最终输出是每种药物和靶点的精细化表示,供DTI预测使用。

性能对比与分析

图片

表1. 作者的模型与数据集 DTI 上的基线的比较。每次测量的最高和第二高结果分别以粗体和斜体显示。使用单侧配对 t 检验,与第二高的绩效相比,最佳模型表明 Pvalue 水平有显著改善。* 分别代表 1% 和 0.1% 的显著水平。

研究者基于DrugBank数据集进行对比实验,将MLGANN的表现与多种基线模型进行了比较,包括基于相似性、知识图谱和图神经网络(GNN)的模型。关键评价指标包括精度、召回率、F1得分、AUC(ROC曲线下面积)以及AUPR(精确率-召回率曲线下面积)。

  • 预测精度提升:由于MLGANN有效地利用了多源数据,在AUC和精度等指标上取得了显著的提升。
  • 消融实验:消融实验进一步验证了模型中各层的重要性,表明移除特定层(如药物-疾病相似性)会导致显著的性能下降。
  • 鲁棒性测试:通过随机移除部分训练数据来测试模型的鲁棒性,结果表明MLGANN在不同数据量下仍保持较高性能,并且在训练数据减少时表现出最小的性能衰减。

MLGANN模型对比传统方法的优势

MLGANN模型在多层结构和自注意力机制的加持下展现了超越传统DTI预测方法的显著优势。

区别于仅依赖化学结构或蛋白质序列的模型,MLGANN可以通过整合药物和靶点的多种信息,构建更为全面的潜在相互作用图景,从而能够捕捉更多关键数据。与同质模型不同,MLGANN的多层结构保留了药物-靶点交互的多样性,为更准确的预测提供了保证。MLGANN的设计灵活,可以进一步扩展以融入更多的数据源,使其具有很强的适应性,便于未来在DTI预测中的应用和拓展。

局限性与未来方向

尽管MLGANN在DTI预测中取得了显著进展,但仍然存在一些局限:

  1. 数据依赖性:模型的精度依赖于数据源的质量和完整性,数据缺失或不一致可能导致预测效果下降。
  2. 复杂性与计算成本:多层结构虽然有效,但需要大量计算资源,在计算能力受限的情况下可能限制其应用。

未来的研究可以进一步整合更多样化的生物数据源(如基因组和表观遗传信息)以提高预测的准确性。此外,优化模型的效率并将其应用于真实药物再利用情境,将为其在制药研究中的实际应用奠定基础。

结论

MLGANN在DTI预测领域的创新性是可以将GCN和注意力机制结合在一个多层框架中。MLGANN通过整合多种药物和靶点信息,实现了更准确和稳健的DTI预测,为加速药物发现和再利用提供了巨大潜力。MLGANN在解决现有模型局限的同时,为计算药理学的进一步创新铺平了道路,有助于开发新的治疗策略。

参考资料:Lu, Q., Zhou, Z. & Wang, Q. Multi-layer graph attention neural networks for accurate drug-target interaction mapping. Sci Rep 14, 26119 (2024). https://doi.org/10.1038/s41598-024-75742-1


http://www.kler.cn/a/450755.html

相关文章:

  • Unity3d 基于UGUI和VideoPlayer 实现一个多功能视频播放器功能(含源码)
  • zabbix监控山石系列Hillstone监控模版(适用于zabbix7及以上)
  • GIS 文件格式 及 常规应用总结
  • 【087】基于51单片机智能宠物喂食器【Proteus仿真+Keil程序+报告+原理图】
  • jsp中的四个域对象(Spring MVC)
  • leetcode 2295.替换数组中的元素
  • Java文字识别OCR API-手写文字识别-生僻字识别-应用场景
  • 视频汇聚融合云平台Liveweb一站式解决视频资源管理痛点
  • 京准电钟解读,NTP网络授时服务器如何提升DCS系统效率
  • 《Vue3 三》Vue 中的 options 选项
  • 使用Qwn2-VL模型批量标注图像内容(图像理解)
  • php中 cli和cgi的区别
  • python 聚类实战
  • 美国加州房价数据分析01
  • 软件测试面试题和简历模板(面试前准备篇)
  • 力扣第115题:不同的子序列 — C语言解法
  • golang , chan学习
  • 62.基于SpringBoot + Vue实现的前后端分离-驾校预约学习系统(项目+论文)
  • Java面试题精选:MyBatis(一)
  • 使用RKNN进行YOLOv8人体姿态估计的实战教程:yolov8-pose.onnx转yolov8-pose.rknn+推理全流程
  • Excel生成DBC脚本源文件
  • 分布式 IO 模块:赋能造纸业,革新高速纸机主传动
  • 【MFC】如何修改多文档视图的标签
  • 深入解析Android Recovery系统
  • 代写软件标书哪里找:如何让标书撰写变得高效轻松
  • 自动驾驶---Parking端到端架构