1. 项目概述当电流互感器“说谎”时如何让变压器保护更聪明在电力系统的心脏——变电站里大型电力变压器是价值最高、也最关键的设备之一。它的安全运行直接关系到整个电网的稳定。而守护这台“心脏”的“免疫系统”就是差动保护。差动保护的原理听起来很直观比较变压器两侧的电流如果“有进无出”差值超过阈值就判定为内部发生了短路故障立即跳闸隔离防止事故扩大。但这个看似完美的逻辑在实际运行中却面临两大“天敌”励磁涌流和电流互感器CT饱和。变压器空载合闸时由于铁芯磁通的饱和会产生一个幅值很大、含有大量二次谐波的暂态电流这就是励磁涌流。它只流过变压器的一侧在差动保护看来就是一个巨大的“不平衡电流”极易导致保护误动把正常的合闸操作当成故障给切了。更棘手的是CT饱和。当系统发生外部短路等大电流故障时CT的铁芯可能因磁通饱和而无法线性传变电流导致二次侧输出严重畸变。这种畸变会“污染”差动电流的计算可能让保护在外部故障时误动失去选择性或者在内部故障伴随饱和时拒动失去可靠性。传统上工程师们用“谐波制动”来对付涌流用“双斜率特性”或“时差法”来抵御CT饱和的影响。但这些方法本质上是基于固定阈值和经验的“规则”在涌流谐波含量低、CT深度饱和等复杂工况下其性能会大打折扣可靠性与速动性难以兼得。近年来随着人工智能技术的渗透深度神经网络DNN为这个经典难题带来了新的曙光。DNN不依赖预设的物理模型或固定阈值而是直接从海量的故障和涌流数据中学习它们最本质的波形特征和模式差异。今天要深入剖析的就是一篇来自IEEE Access 2025的前沿研究它提出了一种名为“双深度神经网络”Dual-DNN的创新架构。这个方案的精妙之处在于它没有试图用一个网络解决所有问题而是进行了“职责分离”第一个网络Com-DNN专职做“信号修复师”对抗CT饱和带来的信号畸变第二个网络Dis-DNN则扮演“高级诊断专家”在修复后的清晰信号上精准区分涌流和内部故障。这篇文章的价值不仅在于提出了一个性能优异的算法更在于它完整地展示了如何将深度学习理论落地到电力保护这个强实时、高可靠性的工业场景中包括数据预处理、网络设计、超参数优化乃至最终的硬件部署验证。对于从事继电保护、嵌入式AI或工业智能应用的工程师和研究者来说这是一个绝佳的、可供深入参考和复现的工程范本。2. 核心思路拆解为什么是“双网络”架构要理解双DNN架构的巧妙之处我们得先看清问题的本质。变压器差动保护在CT饱和下的故障识别其实是一个串联的两阶段问题信号失真问题CT饱和导致我们采集到的电流波形i_CT,input严重偏离真实的系统电流i_CT,target。这个失真信号如果直接送给故障判别逻辑就像医生看着一张模糊扭曲的X光片做诊断误判风险极高。模式分类问题在获得相对真实的电流信号后需要从复杂的暂态波形中准确识别出“励磁涌流”和“内部故障”这两种截然不同的模式。传统的单一模型思路无论是基于谐波、波形导数还是简单的机器学习模型都试图用一个模型或一套规则同时应对这两个问题。这就像要求一位专家既精通精密仪器维修又擅长疾病诊断在极端复杂情况下难免力不从心。2.1 分而治之的设计哲学双DNN架构采用了“分而治之”的策略其核心流程如下图所示概念示意[原始畸变电流信号] - [数据预处理] - [Com-DNN补偿网络] - [修复后的电流信号] - [计算差动电流] - [Dis-DNN识别网络] - [输出正常/暂态/涌流/故障]Com-DNN补偿网络的使命它的目标非常纯粹——学习从饱和畸变的二次侧电流到理想一次侧电流的映射关系。你可以把它想象成一个高级的“去饱和滤波器”。它不关心这个电流是涌流还是故障电流只关心如何把被CT饱和“污染”的波形尽可能还原成干净、真实的波形。这一定位使得Com-DNN可以专注于学习饱和的物理特征如波形削顶、相位偏移、谐波畸变等模型的复杂度得以控制训练目标也更清晰。Dis-DNN识别网络的使命它接收的是经过Com-DNN“净化”后的差动电流信号。在这个相对干净的信号基础上Dis-DNN的任务是进行四分类正常状态、暂态过程、励磁涌流、内部故障。它的设计可以更专注于波形模式的细微差别例如涌流波形的不对称性和间断角故障电流的对称性和持续性等。这种职责分离带来了几个显著优势专业化提升性能每个网络只需解决一个相对单一的问题模型可以设计得更精准训练更高效。模块化便于维护与升级补偿算法或识别算法可以独立改进。例如未来若有更先进的信号补偿技术可以替换Com-DNN而Dis-DNN无需重新训练。增强系统鲁棒性即使某种新型的CT饱和训练数据未充分覆盖导致Com-DNN补偿效果略有下降只要信号畸变被部分纠正Dis-DNN基于模式识别的能力仍有可能做出正确判断提供了双重保障。2.2 为何选择堆叠去噪自编码器SDAE原文中两个DNN的核心组件都是堆叠去噪自编码器。这又是一个关键选择。自编码器Autoencoder, AE是一种无监督学习网络目标是学习输入数据的高效编码特征表示并能从这个编码中重构出原始输入。去噪自编码器DAE则在其输入中主动加入噪声在本文中CT饱和畸变和系统噪声就是天然的“噪声”强制网络学习去除噪声、恢复纯净信号的能力。这与Com-DNN的目标完美契合。将多个DAE堆叠起来就形成了SDAE。低层的DAE学习基础特征如波形的局部形状高层的DAE在这些基础特征上学习更抽象、更全局的特征如整个周波的模式。这种深层结构非常适合捕捉电力暂态信号中复杂的时空依赖关系。对于Dis-DNNSDAE先通过无监督学习从海量的差动电流数据中自动提取出最具判别力的特征这个过程不依赖于人工标注的“特征工程”。然后在这些学习到的特征之上添加一个Softmax分类层进行有监督的微调最终完成分类任务。这种方法比直接设计一个全连接深度网络ANN或卷积网络CNN更能学习到数据的内在结构尤其在数据带有噪声和畸变时表现出更强的鲁棒性。实操心得模型选型的权衡在工程实践中选择SDAE而非更流行的CNN或Transformer是基于对问题域和部署环境的深思熟虑。变压器电流信号是一维时间序列CNN的卷积核擅长捕捉局部空间特征但对于电力信号中精确的相位、幅值时序关系其优势并不绝对。Transformer虽然强大但计算量和模型复杂度对保护装置的硬件是巨大挑战。SDAE结构相对清晰训练稳定且其“编码-解码”的思想与“去饱和-再识别”的物理过程有直观对应模型的可解释性相对更好这对于可靠性的保护系统至关重要。3. 从理论到实现双DNN方案的关键技术细节理解了“为什么”之后我们深入看看“怎么做”。原文提供了相当完整的技术路径这里我们将其拆解为可操作的步骤并补充一些工程实现中必须考虑的细节。3.1 数据准备与预处理一切的基础任何机器学习项目的成功八成依赖于数据。对于继电保护应用数据仿真与预处理更是重中之重。1. 仿真数据生成研究基于PSCAD/EMTDC电磁暂态仿真软件搭建了一个典型的154/23 kV配电系统模型包含一台40 MVA Y-Y接线的变压器。关键是要模拟出各种可能场景励磁涌流通过改变合闸角0°-360°、残余磁通高达80%、系统阻抗等参数生成323种不同的涌流模式总计超过41万组训练数据。内部故障主要模拟了A相接地A-G故障通过改变故障初相角、过渡电阻、故障位置等生成171种故障模式总计近22万组数据。CT饱和在PSCAD中使用JA模型精确模拟CT的磁化曲线和磁滞回环通过设置不同的一次系统时间常数、二次负载、故障电流倍数等生成不同程度的饱和波形供Com-DNN学习。2. 核心预处理技术数据窗Data Window, DW与归一化这是将连续波形信号转化为深度学习模型可处理输入的关键一步。数据窗DW技术模型不是处理单个采样点而是处理一个时间窗口的数据。文中采用一个周波64个采样点对应60Hz系统下3840Hz采样率作为窗口长度。对于一个电流序列i [x1, x2, ..., xn]通过滑动窗口生成一系列子序列作为输入样本。例如第一个样本是[x1, x2, ..., x64]第二个是[x2, x3, ..., x65]以此类推。这种方法让网络能够看到波形的局部变化趋势对于识别涌流的间断角或故障的突变点至关重要。归一化Normalization电流幅值可能从几十安培到几千安培直接输入网络会导致梯度爆炸或消失训练不稳定。文中采用最大最小值归一化将每个数据窗内的数据缩放到[-1, 1]区间。公式为i_norm i_k / max(|i|)其中i_k是窗内第k个采样点max(|i|)是该数据窗内绝对值的最大值。这种按窗归一化的方式保留了窗内波形的相对形状同时消除了绝对幅值的影响使模型更关注波形模式而非绝对大小。3.2 Com-DNN如何教会网络“修复”饱和信号Com-DNN的结构是一个典型的SDAE其输入是CT二次侧饱和电流的一个数据窗输出是对应的、未经饱和的一次侧电流估计值。网络结构与训练输入层接收64维的向量一个周波数据。隐藏层采用多层编码器结构。文中未明确层数和神经元数这通常是超参数调优的结果。激活函数使用Leaky ReLU而非普通ReLU。这是因为电流信号有正有负Leaky ReLU在输入为负时有一个小的斜率如0.01允许梯度反向传播能更好地处理负值避免“神经元死亡”问题。输出层同样是64维向量对应估计的一次侧电流。使用线性激活函数因为这是一个回归问题预测连续值。损失函数采用均方误差MSE作为损失函数目标是让网络输出的估计电流i_CT,estimate尽可能接近仿真的真实一次侧电流i_CT,target。训练技巧在输入数据中可以主动添加不同程度的高斯噪声这相当于一种数据增强能让Com-DNN学习到更鲁棒的特征对实际装置中的测量噪声不敏感。Com-DNN的效果如图6和图7所示即使在CT严重饱和、二次电流严重畸变波形削顶的情况下Com-DNN输出的估计电流也能与真实一次电流高度重合仅在过零点附近有微小振荡。这个“修复”效果为后续的Dis-DNN提供了高质量的输入。3.3 Dis-DNN特征学习与分类的融合艺术Dis-DNN是方案的核心判别器其结构更为精巧融合了无监督特征学习和有监督分类。第一阶段无监督特征学习堆叠DAE首先用大量的、未标记的差动电流数据窗包含正常、涌流、故障等各种状态训练第一个DAE。这个DAE学习从可能含有噪声的输入中重构出干净的差动电流波形同时学习到数据的第一层抽象特征编码。然后冻结第一个DAE的编码器部分将其输出即学习到的特征作为第二个DAE的输入继续训练。这个过程可以重复多次层层堆叠每一层都学习到更高级、更抽象的特征。例如底层可能学习到波形的局部峰值和斜率中层可能学习到半个周波的对称性高层则可能学习到整个周波的模式是“单边尖峰”还是“对称短路”。这个过程完全是数据驱动的不需要人工定义“谐波含量比”、“波形偏度”等特征。第二阶段有监督微调添加分类层在堆叠好的多个DAE编码器顶部添加一个全连接层和Softmax输出层。输出层有4个神经元分别对应“正常”、“暂态”、“涌流”、“内部故障”四个类别的概率。此时使用带有精确标签的数据即每个数据窗都知道它属于哪一类对整个网络进行有监督的微调。网络权重从之前无监督学习到的值开始利用反向传播和交叉熵损失函数进行优化。标签策略文中采用了独热编码One-Hot Encoding。例如[1,0,0,0]代表正常[0,0,1,0]代表涌流。这种编码方式非常适合Softmax分类器。Dis-DNN的决策逻辑网络接收一个数据窗的差动电流经过多层非线性变换最终输出一个四维概率向量。取概率最大的类别作为判别结果。关键在于它的决策是基于整个数据窗的全局模式而非某个瞬时的阈值因此抗干扰能力更强。3.4 超参数优化用贝叶斯优化寻找“最佳配方”神经网络的性能高度依赖于超参数学习率、批大小、每层神经元数量、网络深度等。手动调参如同大海捞针。原文采用了贝叶斯优化Bayesian Optimization, BO这一先进方法。为什么是贝叶斯优化网格搜索在超参数空间均匀采样计算量大且容易陷入维数灾难。随机搜索虽然比网格搜索高效但缺乏智能性可能浪费大量计算在糟糕的参数区域。贝叶斯优化它构建一个目标函数如验证集准确率的概率代理模型通常用高斯过程并根据一个采集函数如期望提升EI来选择下一个最有“潜力”的超参数组合进行评估。它是一种“基于过去经验智能猜测下一步”的方法能用最少的评估次数找到接近最优的超参数组合。操作流程定义超参数搜索空间例如学习率在[1e-5, 1e-2]之间批大小在[32, 256]之间神经元数在[50, 200]之间。随机选取几组初始参数训练模型得到初始性能。基于这些初始结果BO更新代理模型预测整个搜索空间上性能的概率分布。采集函数计算每个未尝试点的“期望提升”选择期望提升最大的点进行下一轮训练。重复步骤3-4直到达到预设的迭代次数或性能收敛。通过BO作者为Com-DNN和Dis-DNN都找到了各自任务上的最优超参数集这是实现论文中高性能指标的重要保障。注意事工程实现的陷阱数据平衡涌流和故障的数据量要尽可能均衡。如果故障样本远少于涌流样本模型会倾向于将所有样本都预测为涌流导致故障漏报拒动。文中通过调整仿真参数生成了数量级相当的数据集。实时性约束保护动作要求在毫秒级完成。一个数据窗是1个周波约16.7msCom-DNN和Dis-DNN的推理时间必须远小于此。这要求网络结构不能过于复杂层数、神经元数需精简并且在硬件部署时需做量化如FP32转INT8和优化。泛化能力模型是在特定变压器参数和系统结构下训练的。在实际应用中需考虑不同容量、不同接线方式如Y-Δ的变压器。文中通过相位补偿和零序电流剔除来适应Y-Δ变压器但这要求模型具备一定的泛化能力或针对不同型号变压器进行微调。4. 性能验证与结果分析纸上谈兵还是真材实料任何新算法都必须经过严格的对比测试。原文将双DNN方案与三种传统或现有方法进行了全面对比UNI-QB基于单向性和四分法的相似性指数方法。HAR传统的二次谐波制动方案。EKF基于扩展卡尔曼滤波的方法。评价指标采用了继电保护领域经典的“三性”准确性ACC所有情况下正确分类的比例。可靠性DEP发生内部故障时保护正确动作的比例。DEP低意味着可能拒动是保护的大忌。安全性SEC无故障或仅为涌流时保护不误动的比例。SEC低意味着可能误动。4.1 典型场景下的性能对决场景一纯励磁涌流图8HAR谐波制动由于涌流初期二次谐波含量高它能快速在起始点识别并制动表现最佳。UNI-QB需要观察一个完整的周波64个采样点来计算指数因此有约一个周波的延迟。双DNNDis-DNN在第58个采样点N-6即做出正确判断延迟小于一个周波速度快于UNI-QB。它不依赖谐波而是通过波形模式识别。场景二纯内部故障伴随CT深度饱和图9EKF表现最差。在电流估计中产生振荡且严重依赖阈值设置导致故障判别出现错误的ON/OFF抖动。UNI-QB同样需要约一个周波延迟。双DNN再次在第58个采样点做出正确判断。即使CT饱和导致波形畸变但经过Com-DNN补偿后Dis-DNN仍能清晰捕捉到故障电流的特征模式。场景三最严苛挑战——合闸于内部故障图10这是传统方法的“滑铁卢”。变压器合闸瞬间产生大涌流同时内部存在故障。HAR被巨大的涌流包含衰减直流分量产生的二次谐波所“欺骗”误判为涌流并持续制动多个周波导致故障无法快速切除后果严重。UNI-QB其单向性指数被故障电流中大的衰减直流分量干扰在最初几个周波也误判为涌流。EKF同样因噪声和估计误差而失效。双DNN一枝独秀。当故障电流进入负半周区域时这是故障电流区别于涌流的关键特征Dis-DNN立即准确识别出内部故障不受谐波含量或阈值不确定性的影响。4.2 量化结果与鲁棒性测试作者在第58个N-6和第61个N-3采样点统计了所有方法的性能指标这两个时间点代表了保护即将做出决策的关键时刻。表格N-6采样点处各方法性能对比摘要方法场景准确性 (ACC)可靠性 (DEP)安全性 (SEC)双DNN涌流98.87%99.49%99.25%UNI-QB涌流98.12%93.46%94.62%HAR涌流99.01%99.87%99.15%EKF涌流95.23%90.11%92.34%双DNN合闸于故障99.37%99.74%99.01%UNI-QB合闸于故障92.45%88.23%90.12%EKF合闸于故障89.67%75.89%80.45%表格N-3采样点处各方法性能对比摘要方法场景准确性 (ACC)可靠性 (DEP)安全性 (SEC)双DNN所有场景100%100%100%UNI-QB涌流/故障~99%~97%~98%EKF合闸于故障93.84%73.56%78.43%从数据可以清晰看出双DNN全面领先在最具挑战性的“合闸于故障”场景下双DNN的优势是压倒性的可靠性DEP接近100%远超其他方法。这意味着它几乎不会在内部故障时拒动。速度与精度的平衡在N-6点故障后约14.5ms双DNN已具备极高的判别精度为快速保护动作赢得了宝贵时间。鲁棒性验证文章还测试了在不同信噪比20dB, 30dB噪声下、以及变压器为Y-Δ接线的情况双DNN均表现出稳定的性能仅检测时刻有微小偏移证明了其良好的抗噪能力和模型泛化能力。t-SNE可视化图15进一步从特征空间证明了Dis-DNN的有效性。它将高维特征降维到2维展示可以看到“正常”、“暂态”、“涌流”、“内部故障”四类样本形成了清晰可分的簇群尤其是内部故障和涌流之间几乎没有重叠直观地说明了网络学习到了区分这两类模式的关键特征。5. 硬件部署实战从仿真到嵌入式系统的跨越算法的仿真性能再优秀如果不能在实际硬件上实时运行也只是空中楼阁。原文的另一个重要贡献是完成了硬件在环HIL测试与部署验证了工程可行性。5.1 硬件平台选择与考量作者选用了TI的TMDSIDK574开发套件其核心是C66x DSP。这个选择非常具有代表性DSP在保护装置中的主导地位现代数字保护装置的核心处理器多是DSP因其强大的实时数字信号处理能力和确定的指令执行时间。C66x DSP的优势支持高精度浮点运算主频可达750MHz计算能力约12 GFLOPS足以应对深度学习模型的推理计算。ADC模块外接AD8688EVM模数转换器16位分辨率采样率设置为每周期64点3840 Hz这与仿真设置一致确保了数据的一致性。5.2 模型部署与优化关键技术将训练好的TensorFlow/Keras模型部署到资源受限的嵌入式DSP上需要一系列优化模型重构与定点化不能直接运行Python模型。需要根据训练好的权重和偏置用C语言重新实现网络的前向传播计算图。精度转换量化这是降低计算量和内存占用的关键。将模型从训练时的FP3232位浮点转换为部署时的INT88位整数。权重和激活值被缩放到8位整数范围内。这会引入微小的精度损失但能大幅提升计算速度、减少内存带宽和功耗。文中通过测试确认INT8量化后的模型性能下降在可接受范围内。计算性能优化利用DSPLIB调用TI提供的C66x DSP函数库DSPLIB其中的矩阵乘法、向量运算等函数都针对DSP硬件进行了高度优化比手写C代码效率高得多。缓存优化精心安排数据在内存中的布局充分利用DSP的多级缓存减少访问低速外部存储器的次数。循环展开手动或通过编译器选项展开计算密集的循环减少循环开销提高指令级并行度。实时性分析文中估算双DNN一次推理前向传播需要约28,353次浮点操作FLOPs。在750MHz的C66x DSP上理论计算时间约为28,353 / (12e9) ≈ 2.36微秒。这远远小于一个采样间隔约260微秒和一个数据窗长度16.7毫秒。这意味着DSP有充足的时间在下一个采样点到来之前完成本次窗数据的推理满足继电保护毫秒级动作的实时性要求。5.3 硬件测试结果与工程启示将硬件测试结果图17图18与仿真结果对比可以发现检测略有延迟硬件上的故障和涌流检测比仿真慢了几个采样点约零点几毫秒。原因分析这是完全正常且可预期的。延迟主要来源于ADC误差与量化噪声实际ADC存在非线性、偏移等误差其量化噪声也会引入高频分量。Com-DNN的微小振荡硬件上运行的Com-DNN输出在过零点附近存在比仿真更明显的微小振荡这些振荡被带入差动电流计算。有限字长效应INT8量化带来的舍入误差。核心结论尽管存在微小延迟和振荡双DNN方案在硬件上依然稳定工作正确识别了所有测试用例。振荡的幅值很小并未对Dis-DNN的判别逻辑产生实质性影响。这充分证明了该方案从算法仿真到嵌入式实现的可行性。实操心得硬件部署的坑与技巧从浮点到定点量化是必由之路但需谨慎。建议采用“训练后量化”或“量化感知训练”。简单地将FP32权重四舍五入到INT8可能会在敏感层如输出层附近造成较大误差。可以使用校准数据集来确定每层激活值的动态范围实现更精确的缩放。内存布局DSP对数据对齐有要求。确保权重矩阵、输入输出缓冲区在内存中按32位或64位对齐可以避免低效的非对齐访问。测试要充分硬件测试不能只测理想波形。应注入各种强度的白噪声、谐波、直流分量模拟最恶劣的现场电磁环境检验算法的鲁棒性极限。留有余量虽然理论计算时间仅2.36微秒但实际运行时还有操作系统开销、任务调度、通信等。工程上至少要留出50%的时间余量以确保在最繁忙时段也不会错过采样中断。6. 总结、局限与展望这项研究为我们展示了一个将前沿深度学习技术应用于传统电力系统保护难题的完整范例。双DNN架构通过“先补偿后识别”的串联思路巧妙地分解了问题复杂度利用SDAE强大的特征学习和去噪能力在CT饱和这一恶劣条件下实现了对变压器内部故障和励磁涌流近乎完美的区分其可靠性DEP和安全性SEC指标在关键场景下达到或接近100%显著优于传统方法。我个人在实际工程化这类算法时的体会是其成功离不开三个层面的紧密结合精准的物理问题建模深刻理解CT饱和、励磁涌流、内部故障的物理本质和波形特征是设计有效数据仿真和网络结构的前提。Com-DNN学习“去饱和”正是基于对CT饱和非线性畸变物理过程的理解。严谨的数据工程覆盖各种运行边界和故障条件的海量仿真数据、贴合工程实际的数据窗预处理、以及解决类别不平衡的策略是模型泛化能力的基石。面向嵌入式的算法优化从网络结构设计避免过深过宽、到超参数搜索贝叶斯优化、再到最终的定点量化与DSP代码优化每一步都贯穿着对实时性、可靠性和有限资源的考量。当然文章也指出了该方案的当前局限这恰恰是未来研究和工程化的方向对变压器铁芯B-H特性的普适性模型是在特定变压器参数下训练的。对于B-H特性磁化曲线迥异的新型变压器如非晶合金变压器其涌流特性可能不同模型可能需要针对性微调或增量学习。和应涌流Sympathetic Inrush的挑战当系统中已运行的变压器在相邻空投变压器时可能会感应产生和应涌流其特性更为复杂。文中提到这是未来需要攻克的难点。数据依赖性与在线学习模型的性能依赖于训练数据的完备性。在实际应用中如何利用少量现场数据对预训练模型进行安全、高效的在线微调是一个重要的工程课题。最后分享一个关键技巧模型的可解释性与“白盒化”尝试。尽管DNN是“黑盒”但在保护领域我们仍需尽力理解其决策依据。可以尝试使用梯度加权类激活映射或构造特征重要性分析等方法观察Dis-DNN在判断涌流和故障时重点关注的是电流波形的哪个相位区间、哪种变化模式。这不仅能增加工程师对算法的信任也能在模型误判时提供有价值的诊断线索。将深度学习的强大模式识别能力与保护领域专家的先验知识相结合是推动智能继电保护走向成熟应用的必由之路。