当前位置: 首页 > news >正文

AI全景之第五章第五节:图神经网络(GNN)与几何深度学习

5.5 图神经网络(GNN)与几何深度学习

学习目标

掌握图神经网络的核心原理与消息传递机制,理解GNN在结构化数据上的优势,学习主流GNN架构的设计思想,了解几何深度学习的基本概念,能够将GNN应用于实际图结构数据问题。


一、图结构数据:非欧几里得空间的挑战

1.1 从规则数据到图结构数据

传统神经网络的数据假设
  • 图像:规则网格,局部相邻,平移不变性
  • 文本:序列顺序,固定长度
  • 音频:时间序列,一维连续
图结构数据的特性

G=(V,E)G = (V, E)G=(V,E),其中VVV是节点集合,EEE是边集合。

核心特征

  1. 不规则拓扑:每个节点具有不同的连接数
  2. 置换不变性:节点顺序不影响图结构
  3. 多尺度结构:局部到全局的层级关系
  4. 异构性:节点/边类型多样,属性丰富

1.2 图数据的常见类型

按连接性质分类
图类型特点应用示例
无向图边无方向社交网络(好友关系)
有向图边有方向引用网络(论文引用)
加权图边有权重交通网络(道路流量)
多关系图多种边类型知识图谱(实体关系)
动态图随时间演化社交网络演变
异构图多种节点类型推荐系统(用户-商品)
按规模分类
  • 小规模图:分子图(几十个节点)
  • 中等规模图:蛋白质相互作用(数千节点)
  • 大规模图:社交网络(百万节点+)
  • 极大规模图:互联网链接图(十亿节点+)

1.3 图表示学习的基本问题

节点级别任务
  1. 节点分类:预测节点类别(用户画像)
  2. 节点回归:预测节点数值(蛋白质功能强度)
  3. 链接预测:预测边是否存在(好友推荐)
  4. 节点聚类:发现节点社区(社交圈子)
图级别任务
  1. 图分类:预测整个图的类别(分子毒性)
  2. 图回归:预测图的数值属性(分子性质)
  3. 图生成:生成新图(药物分子设计)
  4. 图匹配:比较图相似度(蛋白质结构比对)

1.4 传统图机器学习方法回顾

基于谱的方法
  • 拉普拉斯特征映射:保留局部邻域关系的降维
  • 图傅里叶变换:在谱域定义图卷积
基于游走的方法
  • DeepWalk:通过随机游走生成节点序列,应用Skip-gram
  • Node2Vec:带偏置的随机游走,平衡BFS和DFS
基于矩阵分解的方法
  • 图分解:将邻接矩阵分解为低维表示

局限性

  1. 浅层模型:无法学习深层特征
  2. 不可扩展:难以处理动态图和大规模图
  3. 泛化能力差:无法迁移到新图结构

二、图神经网络基础:消息传递框架

2.1 消息传递范式

图神经网络的核心是消息传递(Message Passing),包含三个关键步骤:

消息传递的三个阶段
  1. 消息生成(Message):从邻居节点生成消息
    [
    m_{ij}^{(l)} = \phi{(l)}\left(h_i{(l)}, h_j^{(l)}, e_{ij}\right)
    ]

  2. 消息聚合(Aggregate):聚合来自邻居的消息
    [
    m_i^{(l)} = \bigoplus_{j \in \mathcal{N}(i)} m_{ij}^{(l)}
    ]

  3. 节点更新(Update):结合自身特征和聚合消息更新节点表示
    [
    h_i^{(l+1)} = \psi{(l)}\left(h_i{(l)}, m_i^{(l)}\right)
    ]

其中:

  • hi(l)h_i^{(l)}hi(l):节点iii在第lll层的表示
  • eije_{ij}eij:边(i,j)(i,j)(i,j)的特征
  • N(i)\mathcal{N}(i)N(i):节点iii的邻居集合
  • ϕ\phiϕ:消息函数
  • ⨁\bigoplus:聚合函数(如sum、mean、max)
  • ψ\psiψ:更新函数

2.2 图神经网络的表达能力

WL图同构测试

Weisfeiler-Lehman图同构测试是衡量GNN表达能力的理论基准。

WL算法步骤

  1. 初始化:为每个节点分配标签(如节点度数)
  2. 迭代:
    a. 聚合邻居标签的多重集
    b. 哈希聚合结果为新标签
  3. 直到标签稳定或达到最大迭代
GNN与WL等价性
  • 1-WL测试:大多数GNN的表达能力不超过1-WL测试
  • 高阶GNN:通过考虑高阶结构(如子图)增强表达能力
  • 理论界限:消息传递GNN无法区分某些非同构图
提升表达能力的策略
  1. 位置编码:注入节点在图中的位置信息
  2. 子图编码:考虑节点所在的局部子结构
  3. 高阶消息传递:考虑k-hop邻居或路径信息
  4. 等变网络:保证对称性的同时增强表达能力

三、经典图神经网络架构

3.1 图卷积网络(GCN)

频域视角:谱图卷积

GCN基于图谱理论,将卷积定义为傅里叶域的乘积。

图拉普拉斯矩阵
[
L = D - A
]
其中DDD为度矩阵,AAA为邻接矩阵。

归一化拉普拉斯
[
\tilde{L} = I - D{-1/2}AD{-1/2}
]

谱卷积
[
g_\theta \star x = U g_\theta(\Lambda) U^T x
]
其中UUULLL的特征向量矩阵,Λ\LambdaΛ是特征值对角矩阵。

空域视角:一阶近似

为了计算效率,GCN使用切比雪夫多项式的一阶近似:

GCN传播规则
[
H^{(l+1)} = \sigma\left(\tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}} H^{(l)} W^{(l)}\right)
]
其中:

  • A~=A+I\tilde{A} = A + IA~=A+I(添加自环)
  • D~ii=∑jA~ij\tilde{D}_{ii} = \sum_j \tilde{A}_{ij}D~ii=jA~ij
  • H(l)H^{(l)}H(l):第lll层节点特征矩阵
  • W(l)W^{(l)}W(l):可学习权重矩阵
  • σ\sigmaσ:激活函数(如ReLU)
GCN代码实现
importtorchimporttorch.nnasnnimporttorch.nn.functionalasFclassGCNLayer(nn.Module):"""GCN层实现"""def__init__(self,in_features,out_features,bias=True):super().__init__()self.linear=nn.Linear(in_features,out_features,bias=bias)defforward(self,x,adj):""" x: 节点特征矩阵 (n_nodes, in_features) adj: 归一化的邻接矩阵 (n_nodes, n_nodes) """# 线性变换x=self.linear(x)# (n_nodes, out_features)# 邻域聚合x=torch.spmm(adj,x)# 稀疏矩阵乘法returnxclassGCN(nn.Module):"""两层GCN模型"""def__init__(self,n_features,hidden_dim,n_classes,dropout=0.5):super()
http://www.zskr.cn/news/143091.html

相关文章:

  • 数据安全新选择:访答本地知识库
  • C#(更新中)
  • 横河 AQ6370D 光谱分析仪
  • 体重电子秤MCU芯片方案
  • 永磁同步无传感SMO滑模观测器模型 PMSM的滑模观测器Simulink模型 改进了传统一阶滑...
  • 【C++数据结构进阶】吃透 LRU Cache缓存算法:O (1) 效率缓存设计全解析
  • 长云科技光缆牵引机,大范围速度控制拉缆更高效
  • SolidWorks服务器怎么实现研发软件多人共享、数据安全管理
  • Python函数基础 - 教程
  • 【Linux系统编程】(十七)揭秘 Linux 进程创建与终止:从 fork 到 exit 的底层逻辑全解析
  • 【课程设计/毕业设计】基于springboot+Vue的课程设计选题管理系统设计基于SpringBoot和Vue的毕业设计选题管理系统的设计与实现【附源码、数据库、万字文档】
  • 2025 年知名的电缆生产厂家出炉:电缆生产厂家推荐,电缆生产厂家排名盘点(12月新) - 品牌2026
  • 22、多媒体与网络通信实用指南
  • 基于springboot文理医院预约挂号系统
  • 基于单片机的电子密码锁设备
  • 如何做好研发流程的审计与优化
  • 新能源知识库(165)数据中心配储系列之现在数据中心的接入电压如果要改成800伏接入,需要做哪些方面的改造?
  • MATLAB频域分析:频率响应曲线生成教程
  • 亲测!市场热门火锅公司实践分享
  • 链动2+1模式AI智能名片商城小程序:裂变过程驱动的商业新生态构建
  • Alpha158因子初步介绍
  • 深度学习<4>高效模型架构与优化器的“效率革命”
  • 新灵魂女声陈以诺Sarah首张客语唱作专辑《慢花志》今日上线
  • 知网AIGC疑似度多少算安全?2025最新降AI教程(附免费降AI)
  • 2025广州最新新媒体广告代运营服务商TOP5评测!优质品牌权威榜单发布,引领品牌营销新增长 - 全局中转站
  • 工业管道管件构成计量
  • 解析 ‘Fixed-point Arithmetic’ (定点运算):在没有 FPU 的嵌入式 CPU 上替代浮点数的优化逻辑
  • 二次剩余与二次剩余核
  • 论文AI率超过学校要求,怎么把论文AIGC疑似度降到20%?
  • 解析 ‘Memory-mapped I/O’ (MMIO):如何通过 C++ 结构体映射硬件寄存器实现高效驱动开发?