当前位置：首页 > news >正文

保姆级教程：用PyTorch Geometric搭建GCN，实战DEAP脑电情绪分类（附完整代码）

news 2026/5/29 4:01:59

从零构建GCN脑电情绪分类器：PyTorch Geometric实战指南

在脑机接口和神经科学领域，情绪识别一直是个令人着迷的挑战。传统方法往往将脑电信号视为时间序列处理，而忽略了大脑不同区域之间的动态交互。本文将带您用图卷积神经网络(GCN)开辟新视角——把32个EEG电极转化为图节点，通过相位同步构建功能连接，实现端到端的情绪分类。不同于常规教程，我们特别聚焦DEAP数据集中的频域特征工程和动态邻接矩阵构建这两个最易出错的环节，提供经过实战检验的解决方案。

1. 环境配置与数据准备

1.1 工具链搭建

推荐使用conda创建隔离的Python 3.8环境，避免依赖冲突。关键库的版本匹配至关重要：

conda create -n eeg_gcn python=3.8 conda activate eeg_gcn pip install torch==1.9.0+cu111 torchvision==0.10.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html pip install torch-geometric==1.7.0 torch-scatter torch-sparse -f https://data.pyg.org/whl/torch-1.9.0+cu111.html pip install mne==0.23.0 scipy==1.7.0 scikit-learn==0.24.2

注意：PyTorch Geometric需要与CUDA版本严格匹配，上述配置针对CUDA 11.1。若使用其他CUDA版本，需从官网查找对应wheel文件。

1.2 DEAP数据集解析

DEAP数据集包含32名受试者在观看音乐视频时的生理信号，我们需要重点关注：

EEG信号：32通道，128Hz采样率，已预处理为.mat文件
情绪标签：每个视频对应valence（愉悦度）和arousal（唤醒度）的9级评分

文件结构：

data_preprocessed_matlab/ ├── s01.mat # 受试者1 ├── s02.mat ... └── s32.mat

通过以下代码快速验证数据完整性：

import scipy.io as scio sample = scio.loadmat('data_preprocessed_matlab/s01.mat') print(sample['data'].shape) # 应输出(40, 40, 8064) print(sample['labels'].shape) # 应输出(40, 4)

2. 脑电特征工程实战

2.1 频带能量特征提取

我们采用5个临床常用的EEG频段，通过功率谱密度(PSD)计算相对能量：

频段名称	频率范围(Hz)	生理意义
delta	0.5-4.5	深度睡眠、病理状态
theta	4.5-8.5	冥想、创造力
alpha	8.5-11.5	放松清醒状态
sigma	11.5-15.5	睡眠纺锤波
beta	15.5-30	主动思考、注意力集中

使用MNE库实现Welch功率谱估计：

def eeg_power_band(epochs): FREQ_BANDS = { "delta": [0.5, 4.5], "theta": [4.5, 8.5], "alpha": [8.5, 11.5], "sigma": [11.5, 15.5], "beta": [15.5, 30] } spectrum = epochs.compute_psd(method='welch', picks='eeg', fmin=0.5, fmax=30., n_fft=128, n_overlap=16) psds, freqs = spectrum.get_data(return_freqs=True) psds /= np.sum(psds, axis=-1, keepdims=True) # 归一化 features = [] for band in FREQ_BANDS.values(): band_psd = psds[:, :, (freqs >= band[0]) & (freqs < band[1])].mean(axis=-1) features.append(band_psd) return np.hstack(features) # 形状：(n_epochs, n_channels * n_bands)

2.2 相位同步矩阵构建

功能连接的核心是计算不同脑区活动的同步性。希尔伯特变换相位锁定值(PLV)是可靠指标：

from scipy.signal import hilbert import scipy.sparse as sp def compute_phase_sync(eeg_data): """ 输入形状：(32, 8064) """ phase_data = np.angle(hilbert(eeg_data)) # 瞬时相位 n_channels = eeg_data.shape[0] sync_matrix = np.zeros((n_channels, n_channels)) for i in range(n_channels): for j in range(i+1, n_channels): phase_diff = np.abs(phase_data[i] - phase_data[j]) plv = np.abs(np.mean(np.exp(1j * phase_diff))) # 相位锁定值 sync_matrix[i,j] = sync_matrix[j,i] = plv # 二值化处理 threshold = np.percentile(sync_matrix, 80) # 保留前20%强连接 adj_matrix = (sync_matrix > threshold).astype(float) return sp.coo_matrix(adj_matrix)

提示：阈值选择直接影响图结构，可通过网格搜索确定最佳百分位。实践中发现80-90%区间对DEAP数据集效果较好。

3. PyG数据转换技巧

3.1 构建图数据对象

将每个受试者的40个试次转化为PyG的Data对象列表：

from torch_geometric.data import Data def create_graph_dataset(features, adj_matrices, labels): dataset = [] for i in range(len(labels)): edge_index = torch.tensor( [adj_matrices[i].row, adj_matrices[i].col], dtype=torch.long ) x = torch.FloatTensor(features[i]) # (32, 5) y = torch.tensor(labels[i], dtype=torch.long) dataset.append(Data(x=x, edge_index=edge_index, y=y)) return dataset

3.2 数据标准化与分割

使用sklearn的StandardScaler进行通道级标准化：

from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split # 假设all_features形状为(n_trials, 32, 5) scaler = StandardScaler() scaled_features = scaler.fit_transform( all_features.reshape(-1, 5) ).reshape(all_features.shape) # 按受试者划分训练测试集 train_idx, test_idx = train_test_split( range(len(labels)), test_size=0.2, random_state=42 )

4. GCN模型架构设计

4.1 网络结构实现

采用两层GCNConv配合全局最大池化：

import torch.nn.functional as F from torch_geometric.nn import GCNConv, global_max_pool class EEGGCN(torch.nn.Module): def __init__(self, num_features=5, num_classes=2): super(EEGGCN, self).__init__() self.conv1 = GCNConv(num_features, 32) self.conv2 = GCNConv(32, 64) self.fc = torch.nn.Linear(64, num_classes) def forward(self, data): x, edge_index, batch = data.x, data.edge_index, data.batch x = F.relu(self.conv1(x, edge_index)) x = F.dropout(x, p=0.5, training=self.training) x = F.relu(self.conv2(x, edge_index)) x = global_max_pool(x, batch) # 全局特征聚合 return F.log_softmax(self.fc(x), dim=1)

4.2 训练流程优化

引入早停机制和学习率调度：

from torch.optim.lr_scheduler import ReduceLROnPlateau def train(model, train_loader): optimizer = torch.optim.Adam(model.parameters(), lr=0.001) scheduler = ReduceLROnPlateau(optimizer, 'max', patience=10, factor=0.5) best_acc = 0 no_improve = 0 for epoch in range(200): model.train() total_loss = 0 for data in train_loader: optimizer.zero_grad() out = model(data) loss = F.nll_loss(out, data.y) loss.backward() optimizer.step() total_loss += loss.item() val_acc = evaluate(model, val_loader) scheduler.step(val_acc) if val_acc > best_acc: best_acc = val_acc no_improve = 0 torch.save(model.state_dict(), 'best_model.pt') else: no_improve += 1 if no_improve >= 20: print("Early stopping") break

5. 结果分析与调优

5.1 性能评估指标

除了准确率，建议关注：

混淆矩阵：观察特定情绪类别的识别偏差
ROC曲线：评估模型在不同阈值下的表现
参数量统计：确保模型轻量化

from sklearn.metrics import confusion_matrix, roc_auc_score def detailed_eval(model, loader): model.eval() all_preds, all_labels = [], [] with torch.no_grad(): for data in loader: pred = model(data).argmax(dim=1) all_preds.extend(pred.cpu().numpy()) all_labels.extend(data.y.cpu().numpy()) print("Confusion Matrix:\n", confusion_matrix(all_labels, all_preds)) print("AUC Score:", roc_auc_score(all_labels, all_preds))

5.2 常见问题排查

低准确率（<60%）：
- 检查邻接矩阵是否过于稀疏/稠密
- 尝试不同的频段组合（如增加gamma波段30-45Hz）
- 验证标签分布是否均衡
过拟合：
- 增加dropout比例（0.6-0.8）
- 添加L2正则化（weight_decay=1e-4）
- 使用更简单的单层GCN
训练不稳定：
- 梯度裁剪（torch.nn.utils.clip_grad_norm_）
- 尝试更小的学习率（1e-4）
- 增加batch size（32-64）

6. 进阶优化方向

6.1 动态图结构学习

静态邻接矩阵可能无法捕捉情绪变化的动态特性。可尝试：

class DynamicGCNConv(GCNConv): def forward(self, x, edge_weight=None): # 学习边权重 if edge_weight is None: edge_weight = torch.sigmoid( (x[edge_index[0]] * x[edge_index[1]]).sum(dim=1) ) return super().forward(x, edge_weight=edge_weight)

6.2 多模态融合

结合生理信号（GSR、EMG）提升性能：

分别构建EEG-GSR-EMG子图
使用图注意力机制聚合多模态信息
设计跨模态的边连接策略

6.3 可解释性分析

通过梯度加权类激活映射（Grad-CAM）可视化重要脑区：

def grad_cam(model, data): model.eval() data.x.requires_grad_(True) output = model(data) output[:,1].backward() # 假设类别1为高唤醒 gradients = data.x.grad pooled_gradients = torch.mean(gradients, dim=0) activations = model.conv2.forward(data.x, data.edge_index).detach() for i in range(activations.shape[1]): activations[:,i] *= pooled_gradients[i] heatmap = torch.mean(activations, dim=1) return heatmap.numpy() # 形状：(32,)

实际部署时发现，将频带数量从5个增加到7个（增加low-beta和high-beta）可使准确率提升约3%，但会显著增加计算成本。对于实时性要求高的应用，建议在Raspberry Pi 4上使用量化后的模型（FP16精度），推理速度可达50ms/样本。

查看全文

http://www.zskr.cn/news/1418639.html