当前位置: 首页 > news >正文

滑动窗口异常检测方法识别异常数据点

本章主要讲解如何用py实现滑动窗口识别异常值

一、导入数据

这个数据集是有80个样本,前四列分别是是序号、温度,oC、频率,Hz、磁芯材料,后面的1024列是一个周期内的磁通密度B,T

import pandas as pd
import numpy as np
# 读取数据
file_path = "../附件二(测试集) - 副本.xlsx"
df = pd.read_excel(file_path, sheet_name='测试集')

二、提取测量列(4到1023列)

我们只需要第4到1023列的磁通密度特征,对其进行异常值检测

data_cols = df.columns[4:]  # 前4列为序号、温度、频率、磁芯材料
data = df[data_cols].copy()
#%%
# 三、参数设置
window_size = 5   # 滑动窗口大小
threshold = 3.0   # 异常阈值:均值±3*标准差,即3西格玛法

四、滑动窗口异常检测

重点讲解这个函数,传入的第一个参数是一个Series,也就是要识别的一个行;
首先对传入的一个行进行深拷贝,避免影响原来的数值,然后将其类型改成float,便于数值计算;
之后进行循环i,这个i是探查第i个位置,这个位置是处在窗口的两端;
然后定义窗口,当i比较小的时候,这个start默认为0,end会随着探查的位置不断增加:当i=0,start=0,end=1,窗口位置就是[0:1];当i=1时,start=0,end=2,窗口位置就是[0,2];当i=4时,start=0,end=5,窗口位置就是[0:5];之后的话start里面的max就始终取大于0的一边,窗口长度始终为5
然后在每个窗口中根据3sigma原则检测异常,若if成立,则当前的i点就标记为np.nan;
最后返回一个Series

def detect_anomalies(series, window=5, k=3.0):series = series.copy()series_values = series.values.astype(float)for i in range(len(series_values)):# 定义窗口范围start = max(0, i - window + 1)end = i + 1window_data = series_values[start:end]# 计算均值和标准差mean = np.nanmean(window_data)std = np.nanstd(window_data)# 检测异常if std > 0 and abs(series_values[i] - mean) > k * std:series_values[i] = np.nan  # 异常置为 NaNreturn pd.Series(series_values, index=series.index)

五、对每一行进行滑动窗口检测

这里的idx一行一行循环整张表,每轮拿到当前行的索引标记 idx,然后对该行进行滑动窗口处理异常值

for idx in data.index:data.loc[idx] = detect_anomalies(data.loc[idx], window=window_size, k=threshold)

六、将异常检测结果合并回原始数据

df_cleaned = df.copy()
df_cleaned[data_cols] = data
# 保存处理后的数据
df_cleaned.to_excel("2024年C题_滑动窗口处理.xlsx", index=False)
print("异常检测完成,结果已保存至 '2024年C题_滑动窗口处理.xlsx'")
http://www.zskr.cn/news/1524889.html

相关文章:

  • Deceive终极指南:三步实现游戏隐身,享受专属游戏时光
  • 终极指南:3步掌握Switch文件解析神器hactool
  • 2026年莆田市PMP培训机构哪家好?官方授权R.E.P.报考指南 - 众智商学院课程中心
  • 影刀RPA新手教程_条件判断与分支逻辑从入门到工程级实战
  • 2026 宁波天然 A 货翡翠全面回收,手镯吊坠摆件等藏品都可预约上门估价 - 薛定谔的梨花猫
  • 终极AutoHotkey v2转换指南:如何快速完成v1脚本升级的完整方法
  • PowerQUICC II SMC与MCC控制器深度解析:从GCI协议到多通道HDLC实战
  • WSL2深度学习环境配置:用CUDA 11.8和软链接搞定多项目版本隔离
  • 3分钟免费解锁Cursor AI编程助手:终极破解工具使用指南
  • 宇树GO2机器人ROS2 SDK:3小时快速实现智能四足机器人自主导航的完整指南
  • 如何快速美化foobar2000:面向新手的完整指南
  • MPC185硬件加密协处理器寄存器配置详解:DEU、AFEU、MDEU核心单元操作指南
  • MPC8260 IMA编程实战:IDCR接收控制与APC动态带宽管理详解
  • 解决实时面部交换的技术挑战:Deep-Live-Cam的AI驱动架构与性能优化方案
  • ARM9嵌入式系统设计:AHB总线时序与中断控制器AITC深度解析
  • MPC8309 I2C驱动开发:从协议原理到寄存器配置与调试实战
  • 如何快速掌握Dism++:Windows系统维护的终极指南
  • 聊城管道疏通马桶疏通 2026 本地实测|靠谱正规疏通团队 6 家推荐 - 金修达家庭维修
  • 2026年众智商学院中级经济师1280元一门费用怎么核对?工商管理方向试听课和资料领取方式 - 众智商学院职业教育
  • 3种简单方法永久激活IDM:免费解锁下载管理器的终极指南
  • 戴森球计划5000+蓝图库:从新手到专家的工厂设计进化论
  • MPC8260 SIU与中断控制器配置实战:嵌入式系统稳定性的核心保障
  • 大连管道疏通马桶疏通本地人认可的靠谱疏通服务商汇总(2026 新版) - 金修达家庭维修
  • 终极指南:如何快速合并B站缓存视频?安卓用户的完整解决方案
  • 2026年资深健身私教哪家好十家对比:从服务到价格的完整评测 - 速递信息
  • esp32开发与应用(有源蜂鸣器)
  • 寄快递省钱必看:菜鸟快递怎么寄便宜?一单省一半 - 快递物流资讯
  • 专业软装品牌怎么选?米兰软装 品质面料+AI搭配 省心打造理想家居 - 速递信息
  • MPC8260 FCC中断与ATM控制器:嵌入式通信核心机制与实战调优
  • 闲置包包变现避坑!青岛 6 家同城回收门店亲测甄选 - 讯息早知道