当前位置：首页 > news >正文

别再踩坑了！手把手教你用YOLOv5 v6.0 + ONNX在Ubuntu 20.04的ROS上部署目标检测（附VMware虚拟机USB摄像头连接完整流程）

news 2026/5/29 4:16:11

YOLOv5 v6.0与ONNX在ROS中的避坑部署指南：从虚拟机配置到实时检测全流程

第一次在Ubuntu 20.04的ROS环境中部署YOLOv5目标检测模型时，我遇到了无数令人抓狂的问题——从权重版本不匹配导致的诡异报错，到虚拟机USB摄像头死活识别不出来，再到ROS话题配置错误让整个系统瘫痪。经过三天三夜的反复尝试和十几个废弃的虚拟机快照后，终于总结出这份能让你一次成功的完整避坑指南。

1. 环境准备：避开版本兼容性雷区

1.1 虚拟机与Ubuntu配置要点

在VMware Workstation Pro 16.x上安装Ubuntu 20.04时，有几个关键设置直接影响后续开发体验：

磁盘空间分配：建议至少50GB（实际使用中发现40GB在安装完所有依赖后容易爆满）
网络适配器：选择"NAT"模式而非桥接，避免校园网/公司网络的安全限制
3D图形加速：务必勾选"加速3D图形"选项，否则OpenCV窗口会卡顿

# 安装后立即执行的系统更新命令 sudo apt update && sudo apt upgrade -y sudo apt install build-essential cmake git

1.2 YOLOv5版本锁定技巧

网上教程很少强调版本控制的重要性，但这是导致90%失败案例的根源：

使用特定版本的YOLOv5仓库（v6.0分支）：

git clone -b v6.0 https://github.com/ultralytics/yolov5.git cd yolov5 pip install -r requirements.txt

权重文件必须与代码版本匹配，手动下载比自动下载更可靠：
```
wget https://github.com/ultralytics/yolov5/releases/download/v6.0/yolov5s.pt
```

注意：不要使用pip install yolov5这种方式安装，这会获取最新版本导致与教程不兼容

2. ONNX模型转换的隐藏陷阱

2.1 动态维度与静态维度的选择

原始export.py脚本默认生成动态维度模型，但在ROS中最好使用静态维度：

python export.py --weights yolov5s.pt --img 640 --batch 1 --include onnx

关键参数对比表：

参数选项	适用场景	ROS兼容性	推理速度
--dynamic	多变输入尺寸	较差	较慢
--img 640	固定640x640输入	优秀	最快
--batch 1	单帧处理	必需	稳定

2.2 ONNX模型优化的正确姿势

官方推荐的onnxsim工具使用有讲究：

# 错误做法：直接简化原始onnx python -m onnxsim yolov5s.onnx sim_yolov5s.onnx # 正确做法：先检查模型再简化 onnxruntime-tools optimizer --input yolov5s.onnx --output temp.onnx python -m onnxsim temp.onnx sim_yolov5s.onnx

常见简化失败原因及解决方案：

节点不支持：尝试降低onnxsim版本（1.4.1较稳定）
形状推断错误：在export.py中明确指定--img-size
OP版本冲突：确保onnxruntime与onnx版本匹配

3. VMware虚拟机USB摄像头的连接玄学

3.1 服务启动的隐藏步骤

即使按照官方文档操作，USB摄像头也可能无法识别，因为：

Windows服务中需要手动启动两项：
- VMware USB Arbitration Service
- Windows Image Acquisition (WIA)
虚拟机设置中需要添加USB控制器：
- USB兼容性选择"USB3.0"
- 勾选"显示所有USB输入设备"

# PowerShell中检查服务状态的命令 Get-Service | Where-Object {$_.Name -like "*USB*" -or $_.Name -like "*WIA*"}

3.2 Ubuntu端的设备权限配置

识别到设备后还需要解决权限问题：

# 查看视频设备列表 ls -l /dev/video* # 永久解决权限问题（需重启生效） sudo usermod -a -G video $USER sudo tee /etc/udev/rules.d/99-video.rules <<<'SUBSYSTEM=="video*", MODE="0666"'

设备识别异常排查流程：

在VMware右下角USB图标确认设备已连接
执行dmesg | grep USB查看内核日志
尝试不同的USB端口（USB2.0/3.0表现不同）

4. ROS工作空间的正确搭建姿势

4.1 Catkin工作空间初始化陷阱

新手常犯的目录结构错误：

错误结构：

~/catkin_ws/ └── src/ └── yolov5/ # 错误！YOLOv5不应放在ROS工作空间

正确结构：

~/ ├── catkin_ws/ │ └── src/ │ └── yolov5_detect/ # ROS专用包 └── yolov5/ # 原始YOLOv5代码

初始化命令的细节差异：

# 标准初始化（可能缺少依赖） catkin_create_pkg yolov5_detect rospy # 推荐初始化（包含所有必要依赖） catkin_create_pkg yolov5_detect rospy cv_bridge sensor_msgs std_msgs image_transport

4.2 Python节点的特殊处理

ROS对Python3的支持需要额外配置：

在scripts文件夹中创建节点文件时，必须添加shebang：
```
#!/usr/bin/env python3
```

CMakeLists.txt需要显式声明Python3支持：

catkin_python_setup() catkin_install_python(PROGRAMS scripts/detector.py DESTINATION ${CATKIN_PACKAGE_BIN_DESTINATION})

文件权限设置（每次修改后都需要）：
```
chmod +x scripts/detector.py
```

5. 实时检测节点的性能优化技巧

5.1 ONNX Runtime的配置玄机

同样的模型，不同配置性能差异可达300%：

# 基础配置（速度最慢） sess_options = ort.SessionOptions() session = ort.InferenceSession(model_path, sess_options) # 推荐配置（平衡速度与内存） sess_options = ort.SessionOptions() sess_options.graph_optimization_level = ort.GraphOptimizationLevel.ORT_ENABLE_ALL sess_options.execution_mode = ort.ExecutionMode.ORT_SEQUENTIAL session = ort.InferenceSession(model_path, sess_options, providers=['CUDAExecutionProvider'])

5.2 ROS话题传输的优化方案

图像传输是性能瓶颈，实测对比：

传输方式	延迟(ms)	CPU占用	适用场景
原始Image	120	高	调试用
CompressedImage	45	中	常规使用
SharedMemory	18	低	高性能需求

实现CompressedImage传输的修改点：

# 发布端修改 self.publisher = rospy.Publisher('/detections/compressed', CompressedImage, queue_size=1) # 订阅端修改 rospy.Subscriber(input_topic, CompressedImage, self.callback, queue_size=1)

6. 调试技巧与常见问题速查

6.1 必须掌握的ROS调试命令

话题检查：

rostopic hz /usb_cam/image_raw # 检查帧率 rostopic bw /detections # 检查带宽

可视化工具：

rqt_image_view # 实时查看图像话题 rqt_graph # 查看节点连接关系

6.2 典型错误代码及解决方案

报错：ImportError: libGL.so.1: cannot open shared object file
```
sudo apt install libgl1-mesa-glx
```

报错：[ERROR] [1685492835.123456]: bad callback检查回调函数是否包含异常处理：

def detect(self, msg): try: # 处理代码 except Exception as e: rospy.logerr(f"Detection error: {str(e)}")

报错：[usb_cam-2] process has died通常是摄像头权限问题，临时解决方案：
```
sudo chmod 666 /dev/video*
```

7. 进阶优化方向

7.1 使用TensorRT加速推理

ONNX模型可进一步转换为TensorRT引擎：

# 转换命令 trtexec --onnx=sim_yolov5s.onnx --saveEngine=yolov5s.trt --fp16 # ROS节点中的加载方式 import tensorrt as trt runtime = trt.Runtime(trt.Logger(trt.Logger.WARNING)) with open("yolov5s.trt", "rb") as f: engine = runtime.deserialize_cuda_engine(f.read())

7.2 多线程处理架构

避免图像采集与检测相互阻塞：

from threading import Thread from queue import Queue class ProcessingNode: def __init__(self): self.image_queue = Queue(maxsize=2) self.detector_thread = Thread(target=self._detect_loop) self.detector_thread.start() def _detect_loop(self): while not rospy.is_shutdown(): img_msg = self.image_queue.get() # 执行检测...

经过完整测试，这套方案在以下硬件配置能达到稳定性能：