当前位置: 首页 > article >正文

目标检测常见数据集格式

目标检测常见的数据集格式COCO、YOLO、VOC、DATA。

1、COCO

数据标注格式JSON,JSON文件中包含多个关键字段,如info、images、annotations等,分别存储了数据集的基本信息、图像信息和标注信息
COCO数据集的下载
官网地址:http://cocodataset.org/#download
2014年数据集的下载
train2014:http://images.cocodataset.org/zips/train2014.zip
val2014:http://images.cocodataset.org/zips/val2014.zip
http://msvocds.blob.core.windows.net/coco2014/train2014.zip
2017的数据集的下载
http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip
http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip
http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip
在这里插入图片描述

2、YOLO

YOLO算法专用的数据集格式,其标签文件为TXT格式。
每个TXT文件对应一张图片,文件中包含了图片中所有目标的类别和边界框坐标。
TXT文件中的每一行代表一个目标,包括目标的类别编号和边界框的中心坐标(x_center, y_center)、宽度(w)和高度(h),这些值都是相对于整张图片的比例

3、VOC

标签格式XML,每个XML文件对应一张图片,文件中包含了图片中所有目标的位置(通过边界框的坐标表示)和类别信息。
XML文件中包含了图片的文件夹名、文件名、尺寸信息以及一个或多个目标对象的信息。每个目标对象的信息包括类别名、姿态、是否被部分遮挡、是否为难以辨识的物体等,以及边界框的坐标(xmin, ymin, xmax, ymax)
下载:
VOC2007:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html
train/val:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
test:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
VOC2012:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html
train/val:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
在这里插入图片描述

4、DOTA

DOTA是一个遥感图像数据集,专门用于航空图像中的目标检测任务。
DOTA采用旋转框标注方式,以适应遥感图像中目标的任意方向。
标注格式:xml/txt 四点坐标标注
图片
官网:
https://captain-whu.github.io/DOTA/dataset.html
在这里插入图片描述


http://www.kler.cn/a/293416.html

相关文章:

  • Bugku CTF_Web——点login咋没反应
  • C++中string的新特性
  • Diffusion Policy——斯坦福机器人UMI所用的扩散策略:从原理到其编码实现(含Diff-Control、ControlNet详解)
  • 搭建深度学习开发环境
  • vue3+element-plus==> el-form输入响应式失效踩坑!!!!!!!!!!
  • redhat虚拟机
  • 海思Hi3516CV610 超高清智慧视觉 SoC
  • Linux df命令详解,Linux查看磁盘使用情况
  • 【JavaScript】从作用域角度理解闭包
  • 【AIGC半月报】AIGC大模型启元:2024.09(上)
  • 实际开发中git在IDEA中的使用
  • 机器学习之实战篇——MNIST手写数字0~9识别(全连接神经网络模型)
  • UDP通信实现
  • windows下安装elasticSearch和kibana
  • 报错:CPU指令集的问题
  • Nest.js 实战 (十一):配置热重载 HMR 给服务提提速
  • 鸿蒙界面开发——组件(6):属性字符串(StyledString)文本输入
  • Linux_kernel移植uboot07
  • 单例模式singleton
  • C#基础(2)枚举
  • 工作流之Activiti7 和BPMN讲解
  • Elastic Stack--ES集群加密及Kibana的RBAC实战
  • 报错:Reached the max session limit(DM8 达梦数据库)
  • 【C语言】---- 复合数据类型之结构体(Struct)
  • 期权虚值和实值的投资风险有什么不同?
  • docker 安装mongoDB