当前位置: 首页 > news >正文

标注结果YOLO 格式的文件

YOLO 格式(Ultralytics 版)一行代表一个对象,共 5 列或更多:
<class_id> <x_center> <y_center> <width> <height>
 
所有数值都是 归一化 的浮点数(0–1):
  • 坐标 = 像素值 ÷ 图像宽高
  • 框用 中心点 + 宽高 表示
  • 类别编号从 0 开始

1. 单行 5 列(检测)

0 0.512 0.734 0.322 0.481
 

2. 单行 6 列(检测 + 置信度,仅推理结果)

0 0.512 0.734 0.322 0.481 0.92
 

3. 多标签或分割(YOLOv5/v8-seg)

每行 ≥ 5 列,后面依次是 segment points(也是归一化):
<class> <x_c> <y_c> <w> <h> <x1> <y1> <x2> <y2> …
 

换算公式(像素 → YOLO)

复制
x_center = (x_min + x_max) / 2 / img_width
y_center = (y_min + y_max) / 2 / img_height
width    = (x_max - x_min)   / img_width
height   = (y_max - y_min)   / img_height
 

文件命名

与图片同名,扩展名改为 .txt,一图一标,放在同目录或 labels/ 文件夹。

完整示例

图像 0001.jpg 1920×1080,有两个框:
0001.txt
复制
0 0.512 0.734 0.322 0.481
1 0.326 0.215 0.142 0.183
 
即可直接用于 YOLOv5/v7/v8 训练或评估。
http://www.zskr.cn/news/73801.html

相关文章:

  • Webhooks服务(Webhooks.API)
  • 支付流程服务(PaymentProcessor)
  • 软件著作权登记申请-操作流程、内容及注意事项(单人/多人合作开发)
  • Epipolar Geometry(对极几何)介绍
  • eshop前端界面(WebApp)
  • 商品服务(Catalog.API)
  • 嵌入式软件之分层设计
  • 深度学习、机器学习与强化学习的关系:通俗解析(从基础到细分)
  • # Python 3.14去GIL革命:性能飞跃25%与Python之父的冷静警告
  • # 软件危机与复杂性:工程思维的诞生背景
  • 线性回归、多层感知机(MLP)与CNN的区别与联系:通俗解析(MindSpore视角)
  • # Python开发事实规范:从虚拟环境到工程实践的标准清单
  • # Assemble 知识库导航
  • # Nothing Beats Kindness:善意是连接同事间距离的最快桥梁
  • RAG通识
  • 加州第13号法案 - 房产税改革的历史镜鉴
  • # MCP生态全景调研:协议、框架与实现全景图(2025-01)
  • # 【Context7 MCP测试】 RAG技术栈深度调研:Context7 MCP实战测试报告
  • 一只菜鸟学深度学习的日记:入门卷积
  • Markdown图标美化Prompt
  • # RAG开创性论文解读:检索增强生成的技术革命(Meta AI 2020)
  • # RAGAS论文解读:RAG评估的标准框架(2023)
  • eshop创建订单执行流程详解
  • ehop环境搭建
  • Blazor入门
  • 警惕!React服务器组件爆出高危远程代码执行漏洞
  • 12.5每日总结
  • 永久关闭Windows自动更新
  • 大道至简,仅需三行代码训练YOLOv11
  • 球星 C 罗投资 AI 初创 Perplexity;微软开源 VibeVoice-Realtime,低延迟流式输出丨日报