摘要
本发明公开了一种加速图神经网络训练的分簇重排采样方法,该方法包括如下步骤:将原图边序列存储为COO格式;根据给定的参数,对图中的节点进行算法聚类;根据得到的聚类结果对边进行重排;计算GPU可用内存,决定缓存节点的数量;将数据加载到GPU内存中;执行GNN后续采样和计算操作。本发明的目的在于针对目前GNN采样未进行分簇重排预处理的现状,提出了一种加速图神经网络训练的分簇重排采样方法。其核心思想是:在训练前利用先进行聚类,将高相似度节点划分为同一簇,并在簇中对图中边集合进行重排。边的重排顺序是根据连接节点的出度和入度一起决定,存储格式采用COO格式,更大程度上提升了节点的存储效率。由于重排后的边采样子图在结构上具有更好的紧凑性,使得子图构建更高效,GPU内存空间利用率提升,减少每次采样迭代的时间,从而加速GNN训练时间。