cs224w课程学习笔记-第1课
cs224w课程学习笔记第一课 图学习概览
- 一、常见图结构场景
- 二、图信息
- 2.1 图表示
- 2.2 图结构类型
- 2.3 图任务类型
- 1)、节点预测应用案例
- 2)、边预测应用案例
- 3)、 图预测应用案例
- 三、总结
一、常见图结构场景
常见的地铁网,通信网,食物链,疫情传播网,社交网等
上面这些场景的特点(难点)是
- 任意大小和复杂的拓扑结构(即,无空间局部性,如网格)。
- 没有固定的节点顺序或参考点
- 通常是动态的,并且具有多模态特性
接下来的关键是如何将这些场景建模成图,并很好的预测它.
二、图信息
2.1 图表示
根据抽象出来的图G,由节点,边构成,其还可以表示为一个矩阵如第2幅图所示:
使用相邻矩阵来表示图,值得注意的是无向图是对称的,可以看到该链接都是1,若不同链接权重不一样,又可分为是否有权重图;
此外当图很大时,该矩阵会变的非常大,此时可以使用相邻表来进行图的表示
2.2 图结构类型
根据边是否有方向又分为有向图与无向图,
异构图定义如下,现实场景如医药知识图谱,学术图
二分图如下,U元素与V中的元素有联系,如作者与他参与的文章,演员与其参演的电影,食材与食谱等
带自循环的图,以及多子图如下所示
2.3 图任务类型
根据其预测目标可以分为节点预测,边预测与图预测.
1)、节点预测应用案例
蛋白质折叠问题:基于氨基酸序列预测蛋白质的3D结构
其图构建如下,空间图,节点时蛋白质序列中的氨基酸,边时氨基酸之间的接近程度即下图中的二维矩阵.
以ALPHfold系列方法为代表,其流程如下:
- 以氨基酸序列为输入,通过多序列比对(MSA)获取共进化信息。
- 构建一个表示氨基酸对关系的二维矩阵(称为接触图或距离图,类似于空间图的邻接矩阵)。
- 结合GCN或Transformer对这种图信息进行迭代建模,逐步逼近预测的三维结构。
- 在最终阶段,利用能量优化方法对三维坐标进行物理学修正。
2)、边预测应用案例
推荐系统:节点为用户和物品,边为用户与物品间的关系
如下图,以pinsage方案为代表的图神经推荐系统,有如下算法特点:
- 图采样(Graph Sampling):
针对工业应用中图数据规模可能非常庞大的问题,PinSage 使用了一种 随机游走(random walk sampling) 技术,从大图中提取局部的子图进行计算。这样可以有效降低计算量。
再结合“GraphSAGE”算法(Graph Sample and Aggregate),通过局部子图的聚合操作,学习节点的表示。 - 物品节点的特征表示:
PinSage 不仅采用图的结构信息,还引入了高维物品的内容特征(例如图片特征、文本特征等),通过特征融合丰富节点表示。
高效的推荐模型: - PinSage 联合了图神经网络和推荐系统的目标:学习用户和物品之间的相关性向量(Embeddings),从而在嵌入空间中对物品进行排序以生成推荐。
药物副作用预测:给予两个药品,预测其副作用;图构建以药物为节点,相互作用为边,如预测两个药物同时服用时,其导致肌肉溶解问题的概率有多大.
该领域基于图的药物相互作用预测还是是一项前沿研究,结合图神经网络(GNN)方法,可以有效地捕获药物间较复杂的关系特征。
3)、 图预测应用案例
交通领域上的子图预测,图构建如下:
节点 (Nodes):道路段
边 (Edges):道路段之间的连接性
预测 (Prediction):到达时间 (ETA, Estimated Time of Arrival)
其中图时间网络 (Spatio-Temporal Graph Neural Networks, ST-GNN)ST-GNN是当前最常用方法之一。
- 关键思想:结合时序任务特性,引入时间维度,将路网建模为时空图。
- 模型结构:
空间维度:利用GCN或其变体捕捉路段连接关系。
时间维度:通过RNN/LSTM/GRU或1D卷积捕获路段特征的时间变化。 - 应用:用于处理动态交通场景,如实时路况下的ETA预测。
- 优点:能够同时建模空间和时间信息。
药物发现应用,抗生素是小分子图,由此我们可以对其进行图建模,以原子为节点,化学键为边.可做的任务有
1). 性质预测:预测抗生素分子的物理、化学、生物活性性质,例如抗菌活性、毒性、溶解度、pKa值等。
2). 生成任务:生成具有特定生物活性的抗生素分子(例如抗菌活性最优的分子)。
3). 目标优化:基于特定任务(如最低毒性、最高溶解度等)优化分子结构。
如下图所示的图方案,可用于生成新型药物分子、催化剂等
1、图表示: 分子作为图结构,每增加一个新节点、新边,图就变得复杂。
2、学习策略: GCPN根据强化学习策略,决定如何添加节点或边。
3、动态更新: 每一步选定动作并更新状态,直到分子完成。
4、奖励优化: 奖励函数指导模型生成具有高质量性质的分子。
物理仿真应用,节点为粒子,边为粒子之间的相互作用.通过构建图来预测该图是如何演化的.如下图方案,构建图,进行消息传递,然后解码提取动态信息,根据动态信息更新下一步的图.
三、总结
第一课讲解了现实中什么样的场景可以用图来表示,以及图的表示方法如节点,边,相邻矩阵,有无权重;和不同场景衍生出来不同的图结构,如有向无向图,异构图,双边图等.最后介绍了图学习的任务类型及其应用场景,分别有节点任务,如蛋白质空间结构;边任务如推荐系统,药物相互作用;图任务,如交通预测,抗生素预测任务,物理仿真.