补充05:EAP夜班OnCall值守SOP\+交接班标准化台账模板

补充05:EAP夜班OnCall值守SOP\+交接班标准化台账模板

补充05:EAP夜班OnCall值守SOP+交接班标准化台账模板

一、本课学习目标

1、掌握Fab EAP夜班标准化值守流程、故障分级响应、应急处置规范。

2、精通单机/分区/全厂三级故障判定标准、处理时限、上报机制。

3、掌握标准化交接班台账填写规范、遗留问题传递、风险点位交接

4、规避夜班常见人为事故:漏告警、漏处理、漏记录、交接断层、误操作。

5、完全适配厂区稽核、量产SOP合规、新人夜班上岗标准。

二、夜班OnCall核心原则(量产红线)

1、夜班以保量产、保设备在线、保数据完整、保自动化稳定为第一优先级。

2、小故障不过夜、大故障及时升级、异常必须留痕记录。

3、所有变更、重启、配置修改禁止夜间盲目操作,必须评估风险。

4、交接班必须纸面+系统双交接,杜绝口头交接。

三、故障分级标准与响应时限(工厂统一标准)

1、一级故障(全厂级)

定义:多台设备批量离线、EAP服务宕机、数据库异常、全厂自动化中断

响应时限:5分钟内介入,10分钟内升级主管,优先恢复产线

2、二级故障(分区级)

定义:单工艺区多台设备不稳定、频繁断线、Trace大面积缺失

响应时限:10分钟介入,30分钟定位根因

3、三级故障(单机级)

定义:单台设备通信波动、偶尔离线、单参数异常

响应时限:正常巡检处理,当班闭环记录

四、夜班标准化值守SOP

1、到岗点检(每2小时固定巡检)

1、EAP主备服务状态、集群状态

2、Oracle/InfluxDB数据库负载、磁盘使用率

3、全厂设备在线率、断线设备清单

4、批量报警、异常事件筛查

5、网关、OPC、链路状态巡检

2、夜间故障处置流程

发现异常 → 临时恢复保量产 → 日志抓取定位 → 记录根因 → 遗留问题交接 → 次日深度复盘

3、夜间禁止操作红线

1、禁止夜间随意重启EAP主服务、数据库、网关集群

2、禁止夜间批量修改设备模板、协议参数、超时配置

3、禁止夜间无评估上线新版本、新脚本

五、交接班标准化台账规范

台账必填五大模块:

1、当班运行总体状态(在线率、稳定性)

2、当班所有故障记录、处理过程、临时对策

3、未闭环遗留问题、风险点位、需要白班跟进事项

4、设备改造、网关变动、配置变更记录

5、特殊生产情况、临时产线安排

六、典型夜班高频问题处理模板

1、单设备频繁离线:临时重启链路、抓包留存、记录波动时段,次日排查网络抖动

2、数据库磁盘告警:临时清理日志、扩容兜底,次日优化清理策略

3、Trace断层:检查订阅状态、重启采集服务、补传数据

4、批量设备心跳超时:检查核心交换机、网关集群状态,紧急切换备机

七、本课核心总结

1、夜班OnCall核心是稳、保、记、交,优先保量产、其次定位根因。

2、故障分级响应是标准化关键,杜绝小问题拖延、大问题瞒报。

3、交接班台账必须完整留痕,是量产追溯、责任界定的核心依据。

八、课后作业

1、夜班发现全厂设备批量离线,你的标准处置流程是什么?

2、交接班必须重点交接哪四类内容?

3、夜间为什么禁止随意重启核心服务与修改配置?