图神经网络入门：GCN 与 GAT 的原理与 Python 实现

2501_93879500

455人浏览 · 2025-11-02 13:52:45

2501_93879500 · 2025-11-02 13:52:45 发布

图神经网络入门：GCN 与 GAT 的原理与实现

一、图神经网络基础

图神经网络（GNN）用于处理非欧几里得数据（如图结构），核心思想是通过邻域聚合更新节点特征： $$h_v^{(k)} = \sigma \left( \mathbf{W}^{(k)} \cdot \text{AGGREGATE} \left( { h_u^{(k-1)}, \forall u \in \mathcal{N}(v) } \right) \right)$$ 其中 $h_v^{(k)}$ 是节点 $v$ 在第 $k$ 层的特征，$\mathcal{N}(v)$ 表示邻居节点集合。

二、GCN（图卷积网络）原理

GCN通过谱图理论实现卷积操作，单层传播公式： $$H^{(l+1)} = \sigma \left( \hat{D}^{-\frac{1}{2}} \hat{A} \hat{D}^{-\frac{1}{2}} H^{(l)} W^{(l)} \right)$$

$\hat{A} = A + I$（添加自环的邻接矩阵）
$\hat{D}$ 是 $\hat{A}$ 的度矩阵
$H^{(l)}$ 是第 $l$ 层节点特征
每个节点聚合邻居信息时进行归一化处理

三、GAT（图注意力网络）原理

GAT引入注意力机制，节点 $i$ 对邻居 $j$ 的注意力系数： $$\alpha_{ij} = \frac{\exp \left( \text{LeakyReLU} \left( \mathbf{a}^T [W h_i | W h_j] \right) \right)}{\sum_{k \in \mathcal{N}(i)} \exp \left( \text{LeakyReLU} \left( \mathbf{a}^T [W h_i | W h_k] \right) \right)}$$ 输出特征计算： $$h_i' = \sigma \left( \sum_{j \in \mathcal{N}(i)} \alpha_{ij} W h_j \right)$$ 优势：动态学习邻居重要性权重，无需预先知道图结构。

四、Python实现（使用PyTorch Geometric）

1. 环境安装

pip install torch torch-geometric

2. GCN实现

import torch
from torch_geometric.nn import GCNConv

class GCN(torch.nn.Module):
    def __init__(self, in_dim, hidden_dim, out_dim):
        super().__init__()
        self.conv1 = GCNConv(in_dim, hidden_dim)
        self.conv2 = GCNConv(hidden_dim, out_dim)

    def forward(self, data):
        x, edge_index = data.x, data.edge_index
        x = self.conv1(x, edge_index).relu()
        x = self.conv2(x, edge_index)
        return x

3. GAT实现

from torch_geometric.nn import GATConv

class GAT(torch.nn.Module):
    def __init__(self, in_dim, hidden_dim, out_dim, heads=8):
        super().__init__()
        self.conv1 = GATConv(in_dim, hidden_dim, heads=heads)
        self.conv2 = GATConv(hidden_dim*heads, out_dim, heads=1)

    def forward(self, data):
        x, edge_index = data.x, data.edge_index
        x = self.conv1(x, edge_index).relu()
        x = self.conv2(x, edge_index)
        return x

4. 训练示例

dataset = Planetoid(root='/tmp/Cora', name='Cora')  # 加载Cora数据集
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

model = GAT(in_dim=1433, hidden_dim=8, out_dim=7).to(device)  # GCN同理
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)
criterion = torch.nn.CrossEntropyLoss()

for epoch in range(200):
    model.train()
    optimizer.zero_grad()
    out = model(data)
    loss = criterion(out[data.train_mask], data.y[data.train_mask])
    loss.backward()
    optimizer.step()

五、关键对比

特性	GCN	GAT
聚合方式	固定归一化权重	动态注意力权重
计算开销	较低	较高（多头注意力）
表达能力	受限于图结构	可学习邻居重要性
适用场景	结构规则的图（如分子图）	异构图或需关注关键邻居的场景

提示：实际应用中，GAT通常需要更多训练数据以避免过拟合，可通过调整heads参数平衡性能与计算成本。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git