当前位置：首页 > article >正文

编写高效的消息传递代码-对消息进行降维

article 2025/2/19 6:05:46

DGL优化了消息传递的内存消耗和计算速度。利用这些优化的一个常见实践是通过基于内置函数的 update_all() 来开发消息传递功能。

除此之外，考虑到某些图边的数量远远大于节点的数量，DGL建议避免不必要的从点到边的内存拷贝。对于某些情况，比如 GATConv，计算必须在边上保存消息，那么用户就需要调用基于内置函数的
apply_edges()。有时边上的消息可能是高维的，这会非常消耗内存。 DGL建议用户尽量减少边的特征维数。

下面是一个如何通过对节点特征降维来减少消息维度的示例：

该做法执行以下操作：拼接源节点和目标节点特征，然后应用一个线性层，即 W×(u||v)。源节点和目标节点特征维数较高，而线性层输出维数较低。一个直截了当的实现方式如下：（伪代码）

import torch
import torch.nn as nn

linear = nn.Parameter(torch.FloatTensor(size=(node_feat_dim * 2, out_dim)))
def concat_message_function(edges):
     return {'cat_feat': torch.cat([edges.src['feat'], edges.dst['feat']], dim=1)}
g.apply_edges(concat_message_function)
g.edata['out'] = g.edata['cat_feat'] @ linear

建议的实现是将线性操作分成两部分，一个应用于源节点特征，另一个应用于目标节点特征。在最后一个阶段，在边上将以上两部分线性操作的结果相加，即执行 Wl×u+Wr×v，因为 W×(u||v)=Wl×u+Wr×v，其中 Wl和 Wr分别是矩阵 W的左半部分和右半部分：（伪代码）

import dgl.function as fn

linear_src = nn.Parameter(torch.FloatTensor(size=(node_feat_dim, out_dim)))
linear_dst = nn.Parameter(torch.FloatTensor(size=(node_feat_dim, out_dim)))
out_src = g.ndata['feat'] @ linear_src
out_dst = g.ndata['feat'] @ linear_dst
g.srcdata.update({'out_src': out_src})
g.dstdata.update({'out_dst': out_dst})
g.apply_edges(fn.u_add_v('out_src', 'out_dst', 'out'))