突破同质假设!EG-GCN:一种专治“异质图”的图神经网络新方法

还在为你的图神经网络在异质图(Heterophily)上表现不佳而烦恼吗?一篇来自AAAI 2025的论文《Integrating Co-Training with Edge Discrimination to Enhance Graph Neural Networks》提出了一种名为EG-GCN的新模型,巧妙地利用“边判别”与“协同训练”,让GNN在异质图上也能大放异彩。本文将用最通俗易懂的方式,为你深入解析它的原理与创新之处。

一、引言:GNN的“阿喀琉斯之踵”——异质图

图神经网络(GNN)已经成为处理图结构数据的神兵利器,在社交推荐、分子发现等领域大放异彩。传统GNN(如经典的GCN、GAT)的核心是消息传递机制:一个节点通过聚合其邻居节点的信息来更新自己的表示。

这里隐藏着一个核心假设——同质性(Homophily),即“物以类聚,人以群分”,认为相连的节点大概率属于同一类别。这个假设在引文网络(如Cora,相连的论文主题相似)上非常有效。

然而,现实世界中有大量图是异质(Heterophily) 的!例如:

  • 借贷网络:欺诈者更倾向于连接正常用户,而非其他欺诈者。

  • 蛋白质相互作用网络:不同类型的氨基酸相互结合才能形成功能结构。

在异质图上,如果GNN仍然“一视同仁”地聚合所有邻居,相当于把“噪声”和“信号”混在一起学习,效果自然会大打折扣。EG-GCN的提出,正是为了攻克这一难题。

二、EG-GCN的核心思想:分而治之,协同进化

面对一个鱼龙混杂的邻居群体,最直观的想法是什么?就是把“志同道合”的朋友和“观点相左”的对手区分开来,分别从他们那里获取不同的信息。

EG-GCN将这个直觉变成了现实,它的核心思想包含两点:

  1. 分而治之:我们不把所有邻居混为一谈,而是利用一个“边判别器”将邻居分为同质邻居(和我一类的)和异质邻居(和我不一类的),然后分别进行信息聚合。

  2. 协同进化:节点分类的结果可以帮助我们找到更多高置信度的样本,反过来优化“边判别器”;而更精准的边判别又能提升邻居分组质量,从而让节点分类更准。两者形成一个相互促进的良性循环。

下面,我们就来拆解这个精妙的设计。

三、方法深入解析:EG-GCN如何一步步实现突破

为了让你对EG-GCN有一个整体的把握,我们首先来看一下它的模型框架图。

图1:EG-GCN整体框架图

 如图所示,模型主要包含两个核心模块:边判别器分组图卷积模块。整个流程是一个循环往复的协同训练过程:边判别器对图中的边进行分类(红色和蓝色),从而将每个节点的邻居划分为同质组和异质组;分组图卷积模块根据这个分组结果,分别聚合信息并进行节点分类;节点分类预测出的高置信度节点又被用来扩充边判别器的训练集,从而开始下一轮更精准的边判别。

3.1 火眼金睛的“边判别器”

这个模块的任务是回答一个关键问题:任意一条连接两个节点的边,它到底是同质的还是异质的?

这本质上是一个二分类问题。那么,如何判断呢?模型综合考察了两个方面:

  • 节点特征:两个节点的原始特征信息。

  • 结构信息:为了更好地捕捉节点在图中的结构角色,模型还引入了一种名为随机游走的结构编码。它可以理解为节点自身的一种“结构指纹”。对于一个节点 u,其 k 维结构编码 pu​ 定义为:

    其中,是随机游走矩阵,表示从节点u开始经过k步后又回到u的概率。

具体来说,对于一条边 e(u,v),边判别器的工作流程如下:

  1. 构建输入:将节点u和v的特征x与它们各自的结构编码p拼接起来。

  2. 计算节点中间表示:通过一个可学习的权重矩阵W1进行变换,得到节点u和v的中间表示:

    这里的∥表示向量拼接操作。

  3. 输出判别分数:将两个节点的中间表示、它们的差值进行拼接,再通过另一个权重矩阵和Sigmoid函数,输出该边为同质边的概率分数

    这个分数在0到1之间,越接近1,代表这条边是同质边的可能性越大。

图2:边判别器结构示意图。

         该图可以清晰地展示如何将节点u和v的特征、结构编码进行拼接、变换,最终通过MLP和Sigmoid函数得到边的分类分数。

        由于图中异质边的数量可能远少于同质边,为了避免判别器“偏科”,论文中使用了Focal Loss来训练它,这是一种专门处理类别不平衡问题的损失函数。其公式如下,这里了解即可:

3.2 精准的邻居划分

有了边判别器,我们就可以对图中所有的边进行“贴标签”。论文采用了一个简单的阈值法(例如0.5):

对于一个中心节点u,它的邻居们就可以被清晰地划分为两个阵营:

这就为后续的“分而治之”打下了坚实的基础。

3.3 “分而治之”的分组图卷积

这是信息聚合的核心步骤。与传统GNN使用同一套权重聚合所有邻居不同,EG-GCN为两类邻居分别准备了独立的“聚合通道”。

图3:分组图卷积示意图 

该图生动地展示了一个中心节点(黄色)如何将其邻居划分为红色(同质)和蓝色(异质)两组。然后,它使用两套不同的权重矩阵(W_Homo 和 W_Hetero)分别对两组邻居进行信息聚合。最后,将聚合后的信息、以及节点自身的信息融合,得到该节点新的表示。

具体步骤如下:

  1. 分组聚合

    • 使用权重矩阵 专门聚合同质邻居的信息:

    • 使用另一个权重矩阵专门聚合异质邻居的信息:

    • 同时,节点自身的信息也会用一个专门的权重矩阵进行转换:

    论文中,AGG函数采用了类似GCN的带归一化的聚合方式。

  2. 信息融合

    • 将上述三部分信息通过一个带平衡参数  β 的混合器进行融合,再通过激活函数 σ如ReLU),得到节点新的表示:

    参数β用来调节同质邻居信息和异质邻居信息的相对重要性。

通过这种方式,模型既能从“朋友”那里巩固共识,也能从“对手”那里汲取差异化的见解,学到的节点表示自然更加丰富和鲁棒。

3.4 画龙点睛的“协同训练”

最初,边判别器只能从少量已标注节点构成的边中学习,这可能导致判别不准。EG-GCN的协同训练机制巧妙地解决了这个问题。

其过程如下:

  1. 启动:用初始的少量标注节点训练一个初版的边判别器和分组GCN。

  2. 节点预测与筛选:用分组GCN对未标注节点进行预测,得到预测分布 。然后筛选出预测概率最高的一批节点,认为它们的预测标签是可靠的(即高置信度伪标签)。筛选准则为:

    其中 τ 是一个置信度阈值。

  3. 数据扩充:将这些高置信度节点及其伪标签加入到边判别器的训练集中,相当于给判别器提供了更多的“学习资料”。

  4. 迭代优化:用扩充后的数据集重新训练边判别器,得到一个更精准的“火眼金睛”。然后用它重新划分邻居,再训练分组GCN……如此循环数次。

这个过程就像一个“学生”和“老师”相互促进:

  • 分组GCN(学生):在边判别器(老师)的指导下更好地学习。

  • 边判别器(老师):从优秀学生(高置信度预测)那里获得反馈,提升教学水平。

3.5 实验数据分析:参数与鲁棒性的双重验证

为了验证 EG-GCN 的实际效果,论文针对核心参数和模型鲁棒性展开了专项实验,我们结合实验图表来直观解读其表现:

(1)置信度阈值与迭代次数的参数敏感性分析

模型中 “高置信度节点筛选” 的阈值,协同训练的迭代次数,是影响性能的关键参数。下图展示了在 Citeseer(同质图)和 Wisconsin(异质图)数据集上的参数组合效果:

(注:图中颜色深浅对应准确率高低,颜色越浅 / 偏黄表示准确率越高)

可以看到:

Citeseer(图 3 (a))中,当置信度阈值在 0.85~0.95、迭代次数为 4 时,模型准确率达到峰值(约 75%);若阈值过低(<0.8),会引入过多低置信伪标签,导致边判别器精度下降。

在 Wisconsin(图 3 (b))中,阈值取 0.8~0.9、迭代次数为 3 时,准确率接近 90%;异质图对迭代次数更敏感,过多迭代易出现过拟合。这说明 EG-GCN 的参数区间稳定,实际应用中只需小幅调参即可达到最优性能。

(2)拓扑扰动下的鲁棒性验证

现实图数据常存在边添加 / 删除的 “噪声”,论文测试了不同扰动率下 EG-GCN 与基线模型的性能变化:

从图中可以观察到:

随着扰动率(边修改比例)从 0 提升到 25%,GCN、GAT 等传统模型的准确率快速下降(Citeseer 中 GCN 降幅超 30%),而 EG-GCN 的准确率仅小幅波动(Citeseer 中降幅不足 5%)。

在异质图 Wisconsin(图 2 (b))中,EG-GCN 的优势更明显:当扰动率达 25% 时,其准确率仍保持在 70% 以上,远高于 GAT(仅 30%)。这得益于 EG-GCN 的 “边判别 + 协同训练” 机制 —— 它同时依赖节点特征与结构编码,降低了对单一拓扑信息的依赖,因此对结构噪声的抵抗能力更强。

四、简单的总结

EG-GCN的成功在于它用一套非常直观且完整的逻辑解决了异质图学习的难题:

  1. 识别(边判别器):先分清谁是“友”,谁是“敌”。

  2. 分化(邻居划分):将它们分成不同的组。

  3. 聚合(分组图卷积):对不同组采用不同的交流策略。

  4. 进化(协同训练):让识别和聚合两个能力在循环中相互增强。

实验结果表明,EG-GCN不仅在异质图上取得了显著领先的性能,在同质图上也有不俗的表现,展现了其强大的通用性和鲁棒性。这为我们处理复杂的现实世界图数据提供了一个非常有力的新工具。

希望这篇解读能帮助你理解EG-GCN的精妙之处!如果你对图神经网络在异质图上的应用感兴趣,这篇论文绝对是一个不容错过的精彩工作。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐