当前位置: 首页 > article >正文

cs224w课程学习笔记-第1课

cs224w课程学习笔记第一课 图学习概览

  • 一、常见图结构场景
  • 二、图信息
    • 2.1 图表示
    • 2.2 图结构类型
    • 2.3 图任务类型
      • 1)、节点预测应用案例
      • 2)、边预测应用案例
      • 3)、 图预测应用案例
  • 三、总结

一、常见图结构场景

常见的地铁网,通信网,食物链,疫情传播网,社交网等
在这里插入图片描述
上面这些场景的特点(难点)是

  1. 任意大小和复杂的拓扑结构(即,无空间局部性,如网格)。
  2. 没有固定的节点顺序或参考点
  3. 通常是动态的,并且具有多模态特性
    接下来的关键是如何将这些场景建模成图,并很好的预测它.

二、图信息

2.1 图表示

根据抽象出来的图G,由节点,边构成,其还可以表示为一个矩阵如第2幅图所示:
在这里插入图片描述
使用相邻矩阵来表示图,值得注意的是无向图是对称的,可以看到该链接都是1,若不同链接权重不一样,又可分为是否有权重图;
在这里插入图片描述
此外当图很大时,该矩阵会变的非常大,此时可以使用相邻表来进行图的表示
在这里插入图片描述

2.2 图结构类型

根据边是否有方向又分为有向图与无向图,
在这里插入图片描述
异构图定义如下,现实场景如医药知识图谱,学术图
在这里插入图片描述
在这里插入图片描述
二分图如下,U元素与V中的元素有联系,如作者与他参与的文章,演员与其参演的电影,食材与食谱等
在这里插入图片描述
带自循环的图,以及多子图如下所示
在这里插入图片描述

2.3 图任务类型

根据其预测目标可以分为节点预测,边预测与图预测.
在这里插入图片描述

1)、节点预测应用案例

蛋白质折叠问题:基于氨基酸序列预测蛋白质的3D结构
其图构建如下,空间图,节点时蛋白质序列中的氨基酸,边时氨基酸之间的接近程度即下图中的二维矩阵.
以ALPHfold系列方法为代表,其流程如下:

  1. 以氨基酸序列为输入,通过多序列比对(MSA)获取共进化信息。
  2. 构建一个表示氨基酸对关系的二维矩阵(称为接触图或距离图,类似于空间图的邻接矩阵)。
  3. 结合GCN或Transformer对这种图信息进行迭代建模,逐步逼近预测的三维结构。
  4. 在最终阶段,利用能量优化方法对三维坐标进行物理学修正。
    在这里插入图片描述

2)、边预测应用案例

推荐系统:节点为用户和物品,边为用户与物品间的关系
如下图,以pinsage方案为代表的图神经推荐系统,有如下算法特点:

  1. 图采样(Graph Sampling):
    针对工业应用中图数据规模可能非常庞大的问题,PinSage 使用了一种 随机游走(random walk sampling) 技术,从大图中提取局部的子图进行计算。这样可以有效降低计算量。
    再结合“GraphSAGE”算法(Graph Sample and Aggregate),通过局部子图的聚合操作,学习节点的表示。
  2. 物品节点的特征表示:
    PinSage 不仅采用图的结构信息,还引入了高维物品的内容特征(例如图片特征、文本特征等),通过特征融合丰富节点表示。
    高效的推荐模型:
  3. PinSage 联合了图神经网络和推荐系统的目标:学习用户和物品之间的相关性向量(Embeddings),从而在嵌入空间中对物品进行排序以生成推荐。
    在这里插入图片描述
    药物副作用预测:给予两个药品,预测其副作用;图构建以药物为节点,相互作用为边,如预测两个药物同时服用时,其导致肌肉溶解问题的概率有多大.
    该领域基于图的药物相互作用预测还是是一项前沿研究,结合图神经网络(GNN)方法,可以有效地捕获药物间较复杂的关系特征。
    在这里插入图片描述

3)、 图预测应用案例

交通领域上的子图预测,图构建如下:
节点 (Nodes):道路段
边 (Edges):道路段之间的连接性
预测 (Prediction):到达时间 (ETA, Estimated Time of Arrival)
其中图时间网络 (Spatio-Temporal Graph Neural Networks, ST-GNN)ST-GNN是当前最常用方法之一。

  1. 关键思想:结合时序任务特性,引入时间维度,将路网建模为时空图。
  2. 模型结构:
    空间维度:利用GCN或其变体捕捉路段连接关系。
    时间维度:通过RNN/LSTM/GRU或1D卷积捕获路段特征的时间变化。
  3. 应用:用于处理动态交通场景,如实时路况下的ETA预测。
  4. 优点:能够同时建模空间和时间信息。
    在这里插入图片描述
    药物发现应用,抗生素是小分子图,由此我们可以对其进行图建模,以原子为节点,化学键为边.可做的任务有
    1). 性质预测:预测抗生素分子的物理、化学、生物活性性质,例如抗菌活性、毒性、溶解度、pKa值等。
    2). 生成任务:生成具有特定生物活性的抗生素分子(例如抗菌活性最优的分子)。
    3). 目标优化:基于特定任务(如最低毒性、最高溶解度等)优化分子结构。
    如下图所示的图方案,可用于生成新型药物分子、催化剂
    1、图表示: 分子作为图结构,每增加一个新节点、新边,图就变得复杂。
    2、学习策略: GCPN根据强化学习策略,决定如何添加节点或边。
    3、动态更新: 每一步选定动作并更新状态,直到分子完成。
    4、奖励优化: 奖励函数指导模型生成具有高质量性质的分子。
    在这里插入图片描述
    物理仿真应用,节点为粒子,边为粒子之间的相互作用.通过构建图来预测该图是如何演化的.如下图方案,构建图,进行消息传递,然后解码提取动态信息,根据动态信息更新下一步的图.
    在这里插入图片描述

三、总结

第一课讲解了现实中什么样的场景可以用图来表示,以及图的表示方法如节点,边,相邻矩阵,有无权重;和不同场景衍生出来不同的图结构,如有向无向图,异构图,双边图等.最后介绍了图学习的任务类型及其应用场景,分别有节点任务,如蛋白质空间结构;边任务如推荐系统,药物相互作用;图任务,如交通预测,抗生素预测任务,物理仿真.


http://www.kler.cn/a/551703.html

相关文章:

  • 【数据仓库】StarRocks docker部署
  • 快速排序_912. 排序数组(10中排序算法)
  • Axios 如何处理并发请求
  • leetcode 2435. 矩阵中和能被 K 整除的路径
  • Windows系统编程(六)内存操作与InlineHook
  • 国自然青年基金|针对罕见神经上皮肿瘤的小样本影像深度数据挖掘关键技术研究|基金申请·25-02-15
  • 电磁兼容(EMC):整改案例(十二)调整PCB叠层设计解决静电问题
  • [STM32 - 野火] - - - 固件库学习笔记 - - - 十五.设置FLASH的读写保护及解除
  • WebRTC嵌入式视频通话SDK:EasyRTC从免插件到轻量级带来的音视频通话技术
  • AI工具篇:利用DeepSeek+Kimi 辅助生成综述汇报PPT
  • 无人机+低轨卫星:无限距离集群网络技术详解
  • JAVA系列之数组的秘密(数组的一般用法+力扣 斯坦福大学练习精解)
  • Ansible自动化运维中剧本角色(roles)来完成apache服务操作
  • 如何在本地和线上安装和配置RabbitMQ
  • 交换机三层转发原理(涵盖ARP,ICMP,IP协议)
  • 探秘 Python 枚举类型:从基础到实战的深度指南
  • pyqt写一个待办程序
  • IIS asp.net权限不足
  • Android Studio:用handler实现计数
  • 基于遗传算法排课系统