当前位置：首页 > article >正文

吐血奉献精心整理的一大波数据集

article 2025/2/22 2:09:23

80+开源数据集资源汇总（包含目标检测、医学影像、关键点检测、工业检测等方向）

数据集下载汇总链接：https://www.cvmart.net/dataSets数据集将会不断更新，欢迎大家持续关注！

小目标检测

AI-TOD航空图像数据集

数据集下载地址：http://m6z.cn/5MjlYkAI-TOD 在 28,036 张航拍图像中包含 8 个类别的 700,621 个对象实例。与现有航拍图像中的目标检测数据集相比，AI-TOD 中目标的平均大小约为 12.8 像素，远小于其他数据集。

iSAID航空图像大规模数据集

数据集下载地址：http://m6z.cn/6nUrYe现有的 Earth Vision 数据集要么适用于语义分割，要么适用于对象检测。iSAID 是第一个用于航空图像实例分割的基准数据集。这个大规模和密集注释的数据集包含 2,806 张高分辨率图像的 15 个类别的 655,451 个对象实例。iSAID 的显着特征如下：(a) 大量具有高空间分辨率的图像，(b) 十五个重要且常见的类别，(c) 每个类别的大量实例，(d) 每个类别的大量标记实例图像，这可能有助于学习上下文信息，(e) 巨大的对象尺度变化，通常在同一图像内包含小、中和大对象，(f) 图像内具有不同方向的对象的不平衡和不均匀分布，描绘真实-生活空中条件，（g）几个小尺寸物体，外观模糊，只能通过上下文推理来解决，（h）由专业注释者执行的精确实例级注释，由符合良好规范的专家注释者交叉检查和验证定义的指导方针。

图片

TinyPerson数据集

数据集下载地址：http://m6z.cn/6vqF3T在 TinyPerson 中有 1610 个标记图像和 759 个未标记图像（两者主要来自同一视频集），总共有 72651 个注释。

Deepscores 数据集

数据集下载地址：http://m6z.cn/5xgYdYDeepScores 数据集的目标是推进小物体识别的最新技术，并将物体识别问题置于场景理解的背景下。DeepScores 包含高质量的乐谱图像，分为 300 0 000 张书面音乐，其中包含不同形状和大小的符号。拥有近一亿个小对象，这使得我们的数据集不仅独一无二，而且是最大的公共数据集。DeepScores 带有用于对象分类、检测和语义分割的基本事实。因此，DeepScores 总体上对计算机视觉提出了相关挑战，超出了光学音乐识别 (OMR) 研究的范围。

密集行人检测数据集

数据集下载地址：http://m6z.cn/6nUs1CWiderPerson 数据集是野外行人检测基准数据集，其图像选自广泛的场景，不再局限于交通场景。我们选择了 13,382 张图像并标记了大约 400K 带有各种遮挡的注释。我们随机选择 8000/1000/4382 图像作为训练、验证和测试子集。与 CityPersons 和 WIDER FACE 数据集类似，我们不发布测试图像的边界框基本事实。用户需要提交最终的预测文件，我们将进行评估。

加州理工学院行人检测数据集

数据集下载地址：http://m6z.cn/5N3Yk7加州理工学院行人数据集由大约 10 小时的 640x480 30Hz 视频组成，该视频取自在城市环境中通过常规交通行驶的车辆。注释了大约 250,000 帧（在 137 个大约分钟长的片段中），总共 350,000 个边界框和 2300 个独特的行人。注释包括边界框和详细的遮挡标签之间的时间对应关系。

NWPU VHR-10卫星图像数据集

数据集下载地址：http://m6z.cn/5UAbEWNWPU VHR-10 Dataset 是一个用于空间物体检测的 10 级地理遥感数据集，其拥有 650 张包含目标的图像和 150 张背景图像，共计 800 张，目标种类包括飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁和汽车共计 10 个类别。该数据集由西北工业大学于 2014 年发布，相关论文有《Multi-class geospatial object detection and geographic imageclassification based on collection of part detectors》、《A survey on objectdetection in optical remote sensing images》和《Learningrotation-invariant convolutional neural networks for object detection in VHRoptical remote sensing images》。

Inria 航空影像数据集

数据集下载地址：http://m6z.cn/6nUs6sInria 航空影像标注解决了遥感中的一个核心主题：航空影像的自动像素级标注（论文链接）。数据集特点：

覆盖面积 810 平方公里（405 平方公里用于训练，405 平方公里用于测试）
空间分辨率为 0.3 m 的航空正射校正彩色图像
两个语义类的地面实况数据：构建和非构建（仅针对训练子集公开披露）
这些图像涵盖了不同的城市住区，从人口稠密的地区（例如，旧金山的金融区）到高山城镇（例如，奥地利蒂罗尔的 Lienz）。

RSOD遥感图像数据集

数据集下载地址：http://m6z.cn/5EN96H它是一个开放的遥感图像目标检测数据集。数据集包括飞机、油箱、游乐场和立交桥。此数据集的格式为PASCAL VOC。数据集包括4个文件，每个文件用于一种对象。

飞机数据集，446张图片中有4993架飞机。
操场，189张图片中的191个操场。
天桥，176张图片中的180座天桥。
油箱，165张图片中的1586个油箱。

小目标检测数据集

数据集下载地址：http://m6z.cn/616t6R从Internet（例如YouTube或Google）上的图像/视频收集的四个小物体数据集，包括4种类型的图像，可用于小物体目标检测的研究。数据集包含四类：

fly：飞行数据集，包含600个视频帧，平均每帧86±39个物体（648×72 @ 30 fps）。32张图像用于训练（1：6：187），50张图像用于测试（301：6：600）。
honeybee：蜜蜂数据集，包含118张图像，每张图像平均有28±6个蜜蜂（640×480）。数据集被平均分配用于训练和测试集。仅前32张图像用于训练。
seagull：海鸥数据集，包含三个高分辨率图像（624×964），每个图像平均有866±107个海鸥。第一张图片用于训练，其余图片用于测试。
fish：鱼数据集，包含387帧视频数据，平均每帧56±9条鱼（300×410 @ 30 fps）。32张图像进行训练（1：3：94），65张图像进行测试（193：3：387）。

目标检测开源数据集

COCO2017数据集

COCO2017是2017年发布的COCO数据集的一个版本，主要用于COCO在2017年后持有的物体检测任务、关键点检测任务和全景分割任务。

火焰和烟雾图像数据集

数据集链接：http://m6z.cn/6fzn0f该数据集由早期火灾和烟雾的图像数据集组成。数据集由在真实场景中使用手机拍摄的早期火灾和烟雾图像组成。大约有7000张图像数据。图像是在各种照明条件（室内和室外场景）、天气等条件下拍摄的。该数据集非常适合早期火灾和烟雾探测。数据集可用于火灾和烟雾识别、检测、早期火灾和烟雾、异常检测等。数据集还包括典型的家庭场景，如垃圾焚烧、纸塑焚烧、田间作物焚烧、家庭烹饪等。本文仅含100张左右。

DOTA航拍图像数据集

数据集链接：http://m6z.cn/6vIKlJDOTA是用于航空图像中目标检测的大型数据集。它可以用于开发和评估航空图像中的目标探测器。这些图像是从不同的传感器和平台收集的。每个图像的大小在800×800到20000×20000像素之间，包含显示各种比例、方向和形状的对象。DOTA图像中的实例由航空图像解释专家通过任意（8 d.o.f.）四边形进行注释。

AITEX数据集

数据集链接：http://m6z.cn/5DdJL1该数据库由七个不同织物结构的245张4096 x 256像素图像组成。数据库中有140个无缺陷图像，每种类型的织物20个，除此之外，有105幅纺织行业中常见的不同类型的织物缺陷（12种缺陷）图像。图像的大尺寸允许用户使用不同的窗口尺寸，从而增加了样本数量。

T-LESS数据集

数据集链接：http://m6z.cn/5wnucm该数据集采集的目标为工业应用、纹理很少的目标，同时缺乏区别性的颜色，且目标具有对称性和互相关性，数据集由三个同步的传感器获得，一个结构光传感器，一个RGBD sensor，一个高分辨率RGBsensor，从每个传感器分别获得了3.9w训练集和1w测试集，此外为每个目标创建了2个3D model,一个是CAD手工制作的另一个是半自动重建的。训练集图片的背景大多是黑色的，而测试集的图片背景很多变，会包含不同光照、遮挡等等变换（之所以这么做作者说是为了使任务更具有挑战性）。同时作者解释了本数据集的优势在于：1.大量跟工业相关的目标；2.训练集都是在可控的环境下抓取的；3.测试集有大量变换的视角；4.图片是由同步和校准的sensor抓取的；5.准确的6D pose标签；6.每个目标有两种3D模型；

H²O 行人交互检测数据集

数据集链接：http://m6z.cn/6fzmQfH²O由V-COCO数据集中的10301张图像组成，其中添加了3635张图像，这些图像主要包含人与人之间的互动。所有的H²O图像都用一种新的动词分类法进行了注释，包括人与物和人与人之间的互动。该分类法由51个动词组成，分为5类：

描述主语一般姿势的动词
与主语移动方式有关的动词
与宾语互动的动词
描述人与人之间互动的动词
涉及力量或暴力的互动动词

SpotGarbage垃圾识别数据集

数据集链接：http://m6z.cn/5ZMmRG图像中的垃圾（GINI）数据集是SpotGarbage引入的一个数据集，包含2561张图像，956张图像包含垃圾，其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。

NAO自然界对抗样本数据集

数据集链接：http://m6z.cn/5KJWJANAO包含7934张图像和9943个对象，这些图像未经修改，代表了真实世界的场景，但会导致最先进的检测模型以高置信度错误分类。与标准MSCOCO验证集相比，在NAO上评估时，EfficientDet-D7的平均精度（mAP）下降了74.5%。

Labelme 图像数据集

数据集链接：http://m6z.cn/5Sg9NXLabelme Dataset 是用于目标识别的图像数据集，涵盖 1000 多个完全注释和 2000 个部分注释的图像，其中部分注释图像可以被用于训练标记算法，测试集拥有来自于世界不同地方拍摄的图像，这可以保证图片在续联和测试之间会有较大的差异。该数据集由麻省理工学院 –计算机科学和人工智能实验室于 2007 年发布，相关论文有《LabelMe: a database and web-based tool for image annotation》。

印度车辆数据集

数据集链接：http://m6z.cn/6uxAIx该数据集包括小众印度车辆的图像，如Autorikshaw、Tempo、卡车等。该数据集由用于分类和目标检测的小众印度车辆图像组成。据观察，这些小众车辆（如autorickshaw、tempo、trucks等）上几乎没有可用的数据集。这些图像是在白天、晚上和晚上的不同天气条件下拍摄的。该数据集具有各种各样的照明、距离、视点等变化。该数据集代表了一组非常具有挑战性的利基类车辆图像。该数据集可用于驾驶员辅助系统、自动驾驶等的图像识别和目标检测。

Seeing 3D chairs椅子检测模型

数据集链接：http://m6z.cn/5DdK0v椅子数据集包含大约1000个不同三维椅子模型的渲染图像。

SUN09场景理解数据集

数据集链接：http://m6z.cn/60wX8rSUN09数据集包含12000个带注释的图像，其中包含200多个对象类别。它由自然、室内和室外图像组成。每个图像平均包含7个不同的注释对象，每个对象的平均占用率为图像大小的5%。对象类别的频率遵循幂律分布。发布者使用 397 个采样良好的类别进行场景识别，并以此搭配最先进的算法建立新的性能界限。

该数据集由普林斯顿视觉与机器人实验室于 2014 年发布，相关论文有《SUN Database: Large-scale Scene Recognition from Abbey to Zoo》、《SUN Database: Exploring a Large Collection of Scene Categories》。

Unsplash图片检索数据集数据集链接：http://m6z.cn/5wnuoM使用迄今为止公开共享的全球最大的开放检索信息数据集。Unsplash数据集由250000多名贡献摄影师创建，并包含了数十亿次照片搜索的信息和对应的照片信息。由于Unsplash数据集中包含广泛的意图和语义，它为研究和学习提供了新的机会。

HICO-DET人物交互检测数据集

数据集链接：http://m6z.cn/5DdK6DHICO-DET是一个用于检测图像中人-物交互（HOI）的数据集。它包含47776幅图像（列车组38118幅，测试组9658幅），600个HOI类别，由80个宾语类别和117个动词类别构成。HICO-DET提供了超过150k个带注释的人类对象对。V-COCO提供了10346张图像（2533张用于培训，2867张用于验证，4946张用于测试）和16199人的实例。

上海科技大学人群统计数据集

数据集链接：http://m6z.cn/5Sgafn上海科技数据集是一个大规模的人群统计数据集。它由1198张带注释的群组图像组成。数据集分为两部分，A部分包含482张图像，B部分包含716张图像。A部分分为训练和测试子集，分别由300和182张图像组成。B部分分为400和316张图像组成的序列和测试子集。群组图像中的每个人都有一个靠近头部中心的点进行注释。总的来说，该数据集由33065名带注释的人组成。A部分的图像是从互联网上收集的，而B部分的图像是在上海繁忙的街道上收集的。

生活垃圾数据集

数据集链接：http://m6z.cn/6n5Adu大约9000多张独特的图片。该数据集由印度国内常见垃圾对象的图像组成。图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。

RMFD口罩遮挡人脸数据集

数据集下载地址：http://m6z.cn/61z9Fv当前大多数高级人脸识别方法都是基于深度学习而设计的，深度学习取决于大量人脸样本。但是，目前尚没有公开可用的口罩遮挡人脸识别数据集。为此，这项工作提出了三种类型的口罩遮挡人脸数据集，包括口罩遮挡人脸检测数据集（MFDD），真实口罩遮挡人脸识别数据集（RMFRD）和模拟口罩遮挡人脸识别数据集（SMFRD）。基于这些数据集，可以开发口罩遮挡人脸的各种应用。本项目开发的多粒度口罩遮挡人脸识别模型可达到95％的准确性，超过了行业报告的结果。

GTSRB德国交通标志数据集

数据集下载地址：http://m6z.cn/5wJJLA德国交通标志基准测试是在 2011 年国际神经网络联合会议 (IJCNN) 上举办的多类单图像分类挑战赛。我们诚邀相关领域的研究人员参与：该比赛旨在参与者无需特殊领域知识。我们的基准测试具有以下属性：

单图像、多类分类问题
40多个分类
总共超过 50,000 张图片
逼真的大型数据库

VOC2005车辆数据集

数据集下载地址：http://m6z.cn/5U2X4u该数据集中含有自行车、摩托车、汽车、货车的图像数据，可用于CNN模型以实现车辆识别和车辆分类，其中自行车、摩托车、汽车数据来自2005 PASCAL视觉类挑战赛（VOC2005）所使用的数据的筛选处理结果，货车图片来自网络收集，后期通过筛选处理得到。在本数据中，训练数据集与测试数据集占比约为5:1。

Winegrape检测数据集

数据集下载地址：http://m6z.cn/5TikF9WGISD（Wine Grape Instance Segmentation Dataset）是为了提供图像和注释来研究对象检测和实例分割，用于葡萄栽培中基于图像的监测和现场机器人技术。它提供了来自五种不同葡萄品种的实地实例。这些实例显示了葡萄姿势、光照和焦点的变化，包括遗传和物候变化，如形状、颜色和紧实度。可能的用途包括放宽实例分割问题：分类（图像中是否有葡萄？）、语义分割（图像中的“葡萄像素”是什么？）、对象检测（图像中的葡萄在哪里？）、和计数（每个簇有多少浆果？）。

全球小麦检测数据集

数据集下载地址：http://m6z.cn/5wJK64检测小麦穗是一项重要任务，可以估计相关性状，包括穗种群密度和穗特征，如卫生状况、大小、成熟阶段和芒的存在。本数据集包含 4,700 张高分辨率 RGB 图像和 190,000 个标记的小麦头，这些小麦头采集自世界各地不同生长阶段的不同基因型的多个国家。

Linkopings交通标志数据集

数据集下载地址：http://m6z.cn/68ldS0通过记录超过 350 公里的瑞典高速公路和城市道路的序列，创建了一个数据集。一个 1.3 兆像素的彩色摄像机，一个点灰色变色龙，被放置在一辆汽车的仪表板上，从前窗向外看。摄像头略微指向右侧，以便尽可能多地覆盖相关标志。该镜头的焦距为 6.5 毫米，视野约为 41 度。高速公路上的典型速度标志大约为 90 cm 宽，如果要在大约 30 m 的距离处检测到它们，则对应于大约 50 像素的大小。总共记录了超过 20 000 帧，其中每五帧被手动标记。每个标志的标签包含标志类型（人行横道、指定车道右侧、禁止站立或停车、优先道路、让路、50 公里/小时或 30 公里/小时）、能见度状态（遮挡、模糊或可见）和道路状态（是否标志是在正在行驶的道路上或在小路上）。

防护装备-头盔和背心检测

数据集下载地址：http://m6z.cn/61zarT包含 774 个众包图像和 698 个网络挖掘图像。众包和网络挖掘的图像分别包含 2,496 和 2,230 个工人实例。

加州理工学院相机陷阱数据集

数据集链接：https://beerys.github.io/CaltechCameraTraps/该数据集包含来自美国西南部 140 个摄像头位置的 243,100 张图像，带有 21 个动物类别的标签（加上空白），主要是在物种级别（例如，最常见的标签是负鼠、浣熊和土狼），以及大约 66,000 个边界框注释。大约 70% 的图像被标记为空。

水下垃圾检测数据集

数据集下载地址：http://m6z.cn/6nnDQK该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。它们包含许多不同类型的海洋垃圾的图像，这些图像是从现实世界环境中捕获的，提供了处于不同衰减、遮挡和过度生长状态的各种物体。此外，水的清晰度和光的质量因视频而异。这些视频经过处理以提取 5,700 张图像，这些图像构成了该数据集，所有图像都在垃圾实例、植物和动物等生物对象以及 ROV 上标有边界框。

医学影像

3D-IRCADB 脏器分割数据集

数据集链接：http://m6z.cn/6x5OSn3D-IRCADb-01 数据库由 10 名女性和 10 名男性 75% 的肝肿瘤患者的 3D CT 扫描组成。20个文件夹对应20个不同的患者，可以单独下载也可以联合下载。下表提供了图像信息，例如肝脏大小（宽度、深度、高度）或根据 Couninaud 分割的肿瘤位置。它还表明肝脏分割软件可能遇到的主要困难是由于与邻近器官的接触、肝脏的非典型形状或密度，甚至图像中的伪影。

FASCICLE 小腿肌肉超声数据集

数据集链接：http://m6z.cn/631rexFAscicle 小腿肌肉超声数据集是一个由 812 幅小腿肌肉超声图像组成的数据集，用于分析肌肉弱点并预防受伤。该数据集在文章 AW-Net：B 型超声图像上的自动肌肉结构分析以预防伤害中进行了介绍。它结合了由 Ryan Cunningham 等人发表的两篇文章“使用卷积、残差和反卷积神经网络从 B 模式超声图像中估计全区域骨骼肌纤维方向”提供的数据集。和 Neil Cronin 发表的“使用深度学习对肌肉骨骼超声图像进行自动分析”，并附有补充注释。该 zip 文件包含两个数据集，分别分为两个由其作者命名的文件夹。每个数据集的每个图像都有一个匹配的分束分割掩码和一个可按名称识别的腱膜分割掩码。

肿瘤数据集

数据集链接：http://m6z.cn/5zCyGj这一数据集是通过仔细注释几名患有不同器官肿瘤并在多家医院被诊断出的患者的组织图像获得的。该数据集是通过从TCGA存档下载以 40 倍放大倍率捕获的 H&E 染色组织图像创建的。H&E 染色是增强组织切片对比度的常规方案，通常用于肿瘤评估（分级、分期等）。考虑到多个器官和患者的细胞核外观的多样性，以及多家医院采用的丰富染色方案，训练数据集将能够开发出开箱即用的稳健且可推广的细胞核分割技术。

结直肠腺癌组织学图像数据集

数据集链接：http://m6z.cn/6axBLk该数据集包含 100 张 H&E 染色的结直肠腺癌组织学图像。出于检测目的，在中心/周围共标记了 29,756 个原子核。其中，有 22,444 个细胞核也具有相关的类别标签，即上皮细胞、炎症细胞、成纤维细胞和其他细胞核。

淋巴结切片的组织病理学数据集

数据集链接：http://m6z.cn/6axBNq本数据集由从淋巴结切片的组织病理学扫描中提取的 327.680 张彩色图像 (96 x 96px) 组成。每个图像都带有一个二进制标签，表示存在转移组织。PCam 为机器学习模型提供了新的基准：大于 CIFAR10，小于 imagenet，可在单个 GPU 上训练。

m2caiSeg腹腔镜图像数据集

数据集链接：http://m6z.cn/5yW8q0m2caiSeg是根据真实世界外科手术的内窥镜视频源创建的。数据由 307 张图像组成，每张图像都针对场景中存在的器官和不同的手术器械进行了注释。

血细胞图像数据集

数据集下载地址：http://m6z.cn/5zdTDb该数据集包含 12,500 张带有细胞类型标签 (CSV) 的增强血细胞图像 (JPEG)。4 种不同细胞类型中的每一种都有大约 3,000 张图像，这些图像被分组到 4 个不同的文件夹中（根据细胞类型）。细胞类型是嗜酸性粒细胞、淋巴细胞、单核细胞和中性粒细胞。

脑肿瘤 MRI 数据集

数据集下载地址：http://m6z.cn/63iHcV该数据集包含7022张人脑 MRI 图像，分为 4 类：胶质瘤-脑膜瘤-无肿瘤和垂体。注意这个数据集中的图像大小是不同的。您可以在预处理并去除多余的边距后将图像调整为所需的大小。

糖尿病性黄斑水肿的OCT图像数据集

数据集下载地址：http://m6z.cn/6xn7cp使用杜克企业数据统一内容浏览器搜索引擎追溯识别杜克眼科中心医学视网膜实践中的患者，并使用与他们就诊相关的 DME (ICD-9 362.07) 计费代码。然后，一名眼科医生使用标准 Spectralis（Heidelberg Engineering，Heidelberg，Germany）61 线体积扫描协议确定了 6 名临床成像的患者，这些患者具有严重的 DME 病理学和不同的图像质量。

身体部位X射线图像数据集

数据集下载地址：http://m6z.cn/5yth1K本数据集收集了来自身体各部位的X光图片

眼病深度学习数据集

数据集下载地址：http://m6z.cn/5yth3m712张片状角膜溃疡的眼部染色图像

皮肤病数据集

数据集下载地址：http://m6z.cn/6pQW7A23类皮肤病的图像数据，图像总数约为 19,500 张，其中大约 15,500 张已在训练集中分割，其余在测试集中分割。

心脏病发作分析和预测数据集

数据集下载地址：http://m6z.cn/6ikH8v本数据集含有303名心脏病患者的数据。

膝关节 X 射线图像数据集

数据集下载地址：http://m6z.cn/6aOU5G该数据集包括从知名医院和诊断中心收集的 1650 张膝关节电子 X 射线图像。X 射线图像是使用 PROTEC PRS 500E X 射线机获取的。原始图像是 8 位灰度图像。每个 X 射线膝关节 X 射线图像均由 2 位医学专家根据 Kellgren 和 Lawrence 等级手动注释/标记。

关键点检测

手部姿势关键点检测数据集

数据集下载链接：http://u3v.cn/6d3lZV数据集由序列构成。在每个序列中，您都可以找到组成它的帧。一个帧由4个彩色图像、4组投影在每个图像平面中的2D关节、4个边界框、1组Leap Motion Controller提供的3D点和4组重新投影到每个相机坐标帧的3D点组成。

动物姿势数据集

数据集下载链接：http://u3v.cn/6kDLfr该数据集提供了五个类别的动物姿势注释：狗、猫、牛、马、羊，在4,000 多张图像中总共有6,000多个实例。此外，该数据集还包含其他7 个动物类别的边界框注释。在论文中查找详细信息。一共标注了 20 个关键点：两只眼睛、喉咙、鼻子、马肩隆、两个耳根、尾根、四个肘部、四个膝盖、四个爪子。

电影人物关节关键点数据集

数据集下载链接：http://u3v.cn/5tW5zx该数据集从流行的好莱坞电影中自动收集了5003个图像数据。这些图像是通过在30部电影的每10帧上运行一个最先进的人检测器获得的。然后，被高度自信地检测到的人（大约2万名候选人）被送往众包市场亚马逊机械土耳其公司（Amazon Mechanical Turk），以获得地面真实标签。每幅图片都由五名特克斯人以0.01美元的价格标注，以标注10个上身关节。在每个图像中取五个标记的中位数，以对离群值注释保持稳健。

MPIIGaze Dataset

数据集下载链接：http://u3v.cn/5BsiEeMPIIGaze数据集包含在三个多月的日常笔记本电脑使用过程中从15名参与者收集的213659张图像。在外观和照明方面，数据集比现有的数据集变化更大。

人体足部关键点数据集

数据集下载链接：http://u3v.cn/5IYvIV现有的人体姿势数据集包含有限的身体部位类型。MPII 数据集标注了脚踝、膝盖、臀部、肩膀、肘部、手腕、颈部、躯干和头顶，而 COCO 还包括一些面部关键点。对于这两个数据集，足部注释仅限于脚踝位置。然而，图形应用程序（例如头像重定向或 3D 人体形状重建）需要足部关键点，例如大脚趾和脚跟。在没有足部信息的情况下，这些方法会遇到诸如糖果包装效果、地板穿透和足部滑冰等问题。为了解决这些问题，COCO 数据集中的一小部分脚实例使用 Clickworker 平台进行标记。它分为来自 COCO 训练集的 14K 注释和来自验证集的 545 个注释。总共标记了 6 个英尺关键点。考虑足部关键点的 3D 坐标而不是表面位置。例如，对于确切的脚趾位置，数据集标记了指甲和皮肤连接之间的区域，并且还通过标记脚趾的中心而不是表面来考虑深度。

人群姿态数据集

数据集下载链接：http://u3v.cn/65x8MQ多人姿态估计是许多计算机视觉任务的基础，近年来取得了重大进展。然而，以前很少有方法研究拥挤场景中的姿态估计问题，而在许多场景中，这仍然是一个具有挑战性和不可避免的问题。此外，目前的基准无法对此类案件进行适当评估。在本文中，我们提出了一种新的有效方法来解决人群中的姿势估计问题，并提出了一个新的数据集来更好地评估算法。

图像去噪

PolyU数据集

数据集下载地址：https://sourl.cn/rMsdE8大多数以前的图像去噪方法都集中在加性高斯白噪声（AWGN）上。然而，随着计算机视觉技术的进步，现实世界中的噪声图像去噪问题也随之而来。为了在实现并发真实世界图像去噪数据集的同时促进对该问题的研究，作者们构建了一个新的基准数据集，其中包含不同自然场景的综合真实世界噪声图像。这些图像是由不同的相机在不同的相机设置下拍摄的。

FMD（荧光显微镜去噪）数据集

数据集下载地址：https://sourl.cn/Wyqrui荧光显微镜使现代生物学取得了巨大的发展。由于其固有的微弱信号，荧光显微镜不仅比摄影噪声大得多，而且还呈现出泊松-高斯噪声，其中泊松噪声或散粒噪声是主要的噪声源。为了获得干净的荧光显微镜图像，非常需要有专门设计用于对荧光显微镜图像进行降噪的有效降噪算法和数据集。虽然存在这样的算法，但没有这样的数据集可用。在本文中，我们通过构建专用于泊松-高斯去噪的数据集 - 荧光显微镜去噪 (FMD) 数据集来填补这一空白。该数据集由 12,000 个真实荧光显微镜图像组成，这些图像使用商业共焦、双光子、宽视野显微镜和代表性生物样本，如细胞、斑马鱼和小鼠脑组织。

SIDD智能手机图像去噪数据集

数据集下载地址：https://sourl.cn/jdpJZ6该数据集包含以下智能手机在不同光照条件下拍摄的 160 对噪声/真实图像：GP: Google Pixel IP: iPhone 7 S6: Samsung Galaxy S6 Edge N6: Motorola Nexus 6 G4: LG G4

SIDD-small数据集

数据集下载地址：https://sourl.cn/kaYGxd一个小型版本的数据集，它由代表 160 个场景实例的160 个图像对（噪声和ground-truth）组成。

Super Resolution Benchmarks

数据集下载地址：https://sourl.cn/Bp6QZs来自于AIM 2022 压缩图像和视频超分辨率挑战赛”中的前 5 名解决方案工作：Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and Restoration

工业检测数据集

坑洼检测数据集

数据集下载地址：http://m6z.cn/5wJJTa本数据集汇总了700个在坑洼处带有3K +注释的图像，用于从道路图像中检测坑洼，检测道路地形和坑洼。

天池铝型材表面缺陷数据集

数据集下载地址：http://m6z.cn/61EksR大赛数据集里有1万份来自实际生产中有瑕疵的铝型材监测影像数据，每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。

Kylberg 纹理数据集

数据集下载地址：http://m6z.cn/61Ekw5在布匹的实际生产过程中，由于各方面因素的影响，会产生污渍、破洞、毛粒等瑕疵，为保证产品质量，需要对布匹进行瑕疵检测。布匹疵点检验是纺织行业生产和质量管理的重要环节，目前人工检测易受主观因素影响，缺乏一致性；并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难道大，导致布匹疵点智能检测是困扰行业多年的技术瓶颈。本数据涵盖了纺织业中布匹的各类重要瑕疵，每张图片含一个或多种瑕疵。数据包括包括素色布和花色布两类，其中，素色布数据约8000张；花色布数据约12000张。

东北大学带钢表面缺陷数据集

数据集下载地址：http://m6z.cn/5U87us数据集收集了夹杂、划痕、压入氧化皮、裂纹、麻点和斑块6种缺陷，每种缺陷300张，图像尺寸为200×200。数据集包括分类和目标检测两部分，不过目标检测的标注中有少量错误，需要注意。

Severstal 带钢缺陷数据集

数据集下载地址：http://m6z.cn/61EkBp该数据集中提供了四种类型的带钢表面缺陷。训练集共有12568张，测试集5506张。图像尺寸为1600×256。

UCI 带钢缺陷数据集

数据集下载地址：http://m6z.cn/61EkUh该数据集包含了7种带钢缺陷类型。这个数据集不是图像数据，而是带钢缺陷的28种特征数据，可用于机器学习项目。钢板故障的7种类型：装饰、Z_划痕、K_划痕、污渍、肮脏、颠簸、其他故障。

DAGM 2007数据集

数据集下载地址：http://m6z.cn/5F5eQV该数据集主要针对纹理背景上的杂项缺陷，为较弱监督的训练数据。包含十个数据集，前六个为训练数据集，后四个为测试数据集。每个数据集均包含以灰度8位PNG格式保存的1000个“无缺陷”图像和150个“有缺陷”图像，每个数据集由不同的纹理模型和缺陷模型生成。“无缺陷”图像显示的背景纹理没有缺陷，“无缺陷”图像的背景纹理上恰好有一个标记的缺陷。所有数据集已随机分为大小相等的训练和测试子数据集。弱标签以椭圆形表示，大致表示缺陷区域。

磁瓦缺陷数据集

数据集下载地址：http://m6z.cn/5F5eSd中国科学院自动所一个课题组收集的数据集，是“Saliency of magnetic tile surface defects”这篇论文的数据集。收集了6种常见磁瓦缺陷的图像，并做了语义分割的标注。

RSDDs铁轨表面缺陷数据集

数据集下载地址：http://m6z.cn/61EkKLRSDDs数据集包含两种类型的数据集：第一种是从快车道捕获的I型RSDDs数据集，其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的II型RSDDs数据集，其中包含128个具有挑战性的图像。两个数据集的每幅图像至少包含一个缺陷，并且背景复杂且噪声很大。RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。

KTH-TIPS 纹理图像数据集

数据集下载地址：http://m6z.cn/61EkMHKTH-TIPS 是一个纹理图像数据集，在不同的光照、角度和尺度下拍摄的不同材质表面纹理图片。类型包括砂纸、铝箔、发泡胶、海绵、灯芯绒、亚麻、棉、黑面包、橙皮和饼干共10类。

印刷电路板（PCB）瑕疵数据集

数据集下载地址：http://m6z.cn/5U87Ji这是一个公共的合成PCB数据集，由北京大学发布，其中包含1386张图像以及6种缺陷（缺失孔，鼠咬坏，开路，短路，杂散，伪铜），用于检测，分类和配准任务。

MIO-TCD车辆分类数据集

数据集下载链接：http://suo.nz/2wf2fh该数据集包含总共 786,702 张图像，其中分类数据集中有 648,959 张图像，定位数据集中有 137,743 张图像，这些图像是在一天中的不同时间和一年中的不同时期由部署在加拿大和美国的数千个交通摄像头采集的。这些图像已被选中以涵盖广泛的挑战，并且代表了当今在城市交通场景中捕获的典型视觉数据。每个运动物体都经过近200人的仔细识别，可以对各种算法进行定量比较和排名。该数据集旨在提供严格的基准测试工具，用于训练和测试现有算法和新算法，用于交通场景中移动车辆的分类和定位。数据集分为两部分：“分类挑战数据集”和“定位挑战数据集”。

时尚产品图片数据集

数据集下载链接：http://suo.nz/2DKP2W每个产品都由类似42431的ID标识。可以在styles.csv中找到所有产品的映射，从images/42431.jpg获取该产品的图像，并从styles/42431.json获取完整的元数据。

水稻病害数据集

数据集下载链接：http://suo.nz/2KB4Fj用于检测不同的水稻病害，2K+ 图像主要涵盖 3 种疾病——褐斑病、Hispa 和叶瘟病。

火灾检测数据集

数据集下载链接：http://suo.nz/2S7hIo检测图像中是否存在火灾，含有来自不同场景的 500 多张图像。

天气和日光类型分类数据集

数据集下载链接：http://suo.nz/2ZziE3用于图像分类的多类天气数据集 (MWD) 是题为“使用异构集成方法从静态图像进行多类天气识别”的研究论文，中使用的一个有价值的数据集。该数据集通过提取用于识别不同天气条件的各种特征，为室外天气分析提供了一个平台。1000 多张图像，具有 5 种以上的不同类别——日出、雨天、多云、傍晚、夜晚等。

安全帽佩戴数据集

数据集下载链接：http://suo.nz/2M6i3r该数据集中有 5000 张图像和 5000 个注释。原始数据集包含三个类别（人、头部和头盔），共有 2501 个标签。此外，原始数据集没有完全标记。我们在结果中的数据集上添加了三个新标签，新标签由六个类别（头盔、带头盔的头部、带头盔的人、头部、不带头盔的人和面部）组成，共有 75578 个标签。

SHWD安全帽佩戴检测数据集

数据集下载链接：http://suo.nz/2TCswQSHWD 提供了用于安全头盔佩戴和人头检测的数据集。它包括7581张图像，其中9044个人体安全头盔佩戴对象（正面）和111514个正常头部对象（未佩戴或负面）。

摩托车头盔检测数据集

数据集下载链接：http://suo.nz/318FBxHELMET 数据集包含 2016 年在缅甸 12 个观测点录制的 910 个摩托车交通视频剪辑。每个视频剪辑的持续时间为 10 秒，以 10fps 的帧速率和 1920x1080 的分辨率记录。该数据集包含 10,006 辆摩托车，超过了现有数据集中可用的摩托车数量。数据集中的 91,000 个带注释帧中的每辆摩托车都用边界框进行注释，并且提供每辆摩托车的骑手人数以及特定位置的头盔使用数据。