当前位置：首页 > news >正文

基于图像识别与YOLO模型的鸣潮自动化架构深度解析

news 2026/6/8 19:06:34

基于图像识别与YOLO模型的鸣潮自动化架构深度解析

【免费下载链接】ok-wuthering-waves鸣潮后台自动战斗自动刷声骸一键日常 Automation for Wuthering Waves项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves

ok-ww（鸣潮自动化脚本）是一个基于图像识别和深度学习模型的游戏自动化框架，采用YOLO目标检测技术和ONNX Runtime推理引擎实现高精度游戏界面识别与控制。本文将从技术架构、核心模块设计、性能优化策略等方面深入分析这一开源项目的技术实现原理。

技术架构概览

ok-ww采用分层架构设计，将图像识别、任务调度、角色控制等功能模块化分离，实现了高内聚低耦合的系统设计。整个系统基于ok-script框架构建，通过Windows接口模拟用户操作，无内存读取、无文件修改，确保了系统的安全性和稳定性。

核心架构组件

├── src/ │ ├── char/ # 角色控制模块 │ ├── combat/ # 战斗检测模块 │ ├── scene/ # 场景识别模块 │ ├── task/ # 任务调度模块 │ ├── OnnxYolo8Detect.py # ONNX YOLO检测引擎 │ ├── OpenVinoYolo8Detect.py # OpenVINO推理引擎 │ └── globals.py # 全局配置管理

图像识别引擎技术实现

YOLO模型集成与优化

项目采用YOLOv8模型进行游戏界面元素检测，支持ONNX Runtime和OpenVINO两种推理引擎。这种双引擎设计提供了灵活的部署选项，用户可以根据硬件配置选择合适的推理后端。

ONNX Runtime实现核心代码：

class OnnxYolo8Detect: def __init__(self, weights='echo.onnx', model_h=640, model_w=640, iou_thres=0.45): # ONNX Runtime初始化 self.session = ort.InferenceSession( weights, providers=['CUDAExecutionProvider', 'CPUExecutionProvider'] ) self.model_actual_input_h = model_h self.model_actual_input_w = model_w def detect(self, image, threshold=0.5, label=-1): # 图像预处理 processed_img, padding = self.letterbox(image) input_tensor = self._preprocess(processed_img) # ONNX推理 outputs = self.session.run(None, {self.input_name: input_tensor}) # 后处理 return self._postprocess(outputs, padding, image.shape[:2], threshold, label)

多分辨率适配策略

系统支持从1600x900到4K分辨率的16:9显示比例，通过动态计算UI元素位置实现跨分辨率适配。核心算法基于相对坐标计算，确保在不同分辨率下都能准确定位游戏界面元素。

def blur_area(width, height): """计算模糊区域，用于处理不同分辨率的UI元素""" blur_width = int(0.12 * width) blur_height = int(0.024 * height) return Box(width * 0.879, height * 0.976, blur_width * 0.973, blur_height * 0.994)

角色控制系统设计

角色工厂模式与策略管理

项目采用工厂模式管理不同角色的战斗策略，每个角色都有独立的控制类，实现了高度可扩展的角色行为系统。

角色工厂实现：

class CharFactory: @staticmethod def get_char_by_pos(task, box, index, old_char): """根据位置获取角色实例""" char_info = task.get_char_info(index) if not char_info: return None char_type = CharFactory._get_char_type(task, char_info) buff_time = CharFactory._get_buff_time(task, char_info) # 创建角色实例 char = CHAR_CLASSES[char_info['name']]( task, index, char_info['name'], confidence=char_info['confidence'], char_type=char_type, buff_time=buff_time ) CharFactory._apply_char_config(task, char, char_info) return char

战斗状态机与技能循环

每个角色实现独立的do_perform()方法，定义了角色的战斗逻辑。系统通过状态机管理技能释放时机、连招组合和角色切换策略。

class BaseChar: def do_perform(self): """基础角色执行方法，子类重写实现具体战斗逻辑""" raise NotImplementedError def switch_next_char(self, post_action=None, free_intro=False, target_low_con=False): """智能角色切换算法""" candidates = self.task.get_chars() if not candidates: return # 根据战斗状态选择最优切换目标 target = self._choose_switch_target( self, candidates, has_intro=free_intro, target_low_con=target_low_con ) if target: self.task.switch_to_char(target.index)

任务调度系统架构

模块化任务设计

任务系统采用模块化设计，每个功能对应独立的任务类，通过统一的基类接口进行调度管理。

任务基类架构：

class BaseWWTask: def __init__(self, *args, **kwargs): self.config = kwargs.get('config', {}) self.task_name = self.__class__.__name__ def run(self): """任务执行入口""" self.ensure_main() self.execute_task_logic() def ensure_main(self, esc=True, time_out=30): """确保游戏处于主界面状态""" # 界面状态检测与恢复逻辑 pass

自动化任务链

系统支持多种自动化任务，包括声骸收集、日常任务、副本挑战等，任务之间可以灵活组合形成完整的工作流。

任务类型	功能描述	技术实现
FarmEchoTask	自动收集声骸	YOLO目标检测 + 路径规划
AutoCombatTask	自动战斗	角色控制 + 状态检测
DailyTask	日常任务	OCR识别 + 界面操作
DomainTask	副本挑战	地图导航 + 战斗循环

性能优化策略

推理引擎优化

项目针对不同硬件平台提供了优化策略：

CUDA加速：支持NVIDIA GPU的CUDA推理
CPU优化：针对Intel CPU的OpenVINO优化
内存管理：智能缓存机制减少重复加载

# 自动选择最优推理引擎 def yolo_model(self): """动态选择YOLO推理引擎""" if hasattr(self, '_yolo_model'): return self._yolo_model # 根据配置选择ONNX或OpenVINO if self.config.get('use_openvino', False): self._yolo_model = OpenVinoYolo8Detect() else: self._yolo_model = OnnxYolo8Detect() return self._yolo_model

图像处理优化

系统采用多种图像处理技术提升识别准确率：

颜色空间转换：针对游戏UI优化颜色识别
模板匹配：快速定位固定UI元素
特征提取：提取关键视觉特征

def isolate_white_text_to_black(cv_image): """将白色文本从背景中分离""" gray = cv2.cvtColor(cv_image, cv2.COLOR_BGR2GRAY) _, binary = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY) return binary

配置管理与扩展机制

动态配置系统

项目采用灵活的配置管理系统，支持运行时配置更新和热重载。

# config.py - 配置管理 key_config_option = ConfigOption('Game Hotkey Config', { 'Echo Key': 'q', 'Liberation Key': 'r', 'Resonance Key': 'e', 'Tool Key': 't', 'Jump Key': 'space', 'Dodge Key': 'lshift', 'Wheel Key': 'tab', }, description='In Game Hotkey for Skills')

插件化扩展

系统支持通过插件机制扩展新功能，开发者可以轻松添加新的角色控制逻辑或任务类型。

扩展新角色的步骤：

在src/char/目录下创建角色类
继承BaseChar基类
实现do_perform()方法
在CharFactory中注册角色

测试与验证体系

自动化测试框架

项目包含完整的测试套件，确保核心功能的稳定性和可靠性。

测试用例示例：

class TestCombatCheck: def test_in_combat_detection(self): """测试战斗状态检测""" task = BaseCombatTask() result = task.in_combat() assert result in [True, False] def test_target_detection(self): """测试目标检测""" task = BaseCombatTask() has_target = task.has_target(double_check=True) assert isinstance(has_target, bool)