当前位置: 首页 > article >正文

水雷探测用水下航行器侧扫声纳成像数据之论文阅读

摘要

在过去的十年中,无人驾驶车辆在水下领域变得越来越普及,因为它们通过减少人类参与来提高操作可靠性。在水下操作时,环境感知对于安全以及导航和轨迹控制等任务至关重要。水雷探测是最危险的操作之一,因为这些系统可能会损坏车辆,若由人操作,还会危及生命。通过侧扫声呐图像自动检测水雷可以提高安全性,同时减少漏报。所收集的数据集包含 2010 年至 2021 年间使用 Teledyne Marine Gavia 自主水下航行器(AUV)拍摄的 1170 张真实声呐图像,其中包含足够的信息,将其内容对象分类为非水雷类海底物体(NOMBO)和类水雷接触物(MILCO)。该数据集已被注释,可快速用于目标检测、分类或图像分割任务。收集此类数据集需要大量的时间和成本,这增加了其稀有性以及对研究和工业发展的重要性。

在这里插入图片描述

数据价值

使用这些数据可以充分发挥声呐图像目标检测和分类的潜力,促进新算法和应用的开发。

这些数据是使用最先进的自主水下航行器(AUV)实时收集的,具有验证已开发模型的巨大潜力。利用这些数据,可以开辟新的研究可能性,实现原本无法实现的突破。

利用此数据集,研究人员可以省去收集现场数据的高昂成本和耗时过程。这将节省资源,使研究人员能够专注于项目的关键方面。

投资于真实数据集是提高水雷探测系统安全性和效率的关键步骤。通过结合真实世界的数据,我们可以显著降低事故概率,并改进现有架构以更好地发挥其作用。

民用和军用科学家可以受益于AUV收集的准确数据,这些数据已经过注释,有利于算法和机器学习的实现。

背景

这些数据是多年来在葡萄牙海岸沿线,由葡萄牙海军的潜水扫雷队第三分队(Destacamento de Mergulhadores Sapadores - DMS 3)执行任务期间收集的。由于葡萄牙海军(PoN)的研究和开发工作,每个机会都被用来收集数据,这些数据通常用于参与国家和国际海事领域的项目。PoN研究中心(Centro de Investigação Naval - CINAV)负责收集和使用用于水雷探测的水下声呐图像的最新项目是开放合作欧洲海事意识(OCEAN 2020)项目,该项目在2018年至2021年期间根据欧盟的防御研究准备行动计划(PADR)资助。该项目支持使用无人驾驶车辆(UVs)集成到舰队行动中的海上监视和拦截任务。

数据描述

该数据集包含1170张侧扫声呐图像,这些图像是使用Teledyne Marine Gavia自主水下航行器(AUV)配备的900–1800 kHz Marine Sonic双频侧扫声呐收集的。所有图像都经过仔细分析和注释,包括检测到的对象的边界框(Bounding Box,BB)图像坐标,这些对象分为非水雷类海底物体(NOMBO)和类水雷接触物(MILCO)类别。表1描述了每年数据集图像的数量以及相应的MILCO和NOMBO出现次数。
在这里插入图片描述
该数据集按年份分为五个“.zip”文件,每个文件包含编号为“XXXX_YYYY.jpg”的图像,以及对应的注释文件“XXXX_YYYY.txt”,其中“XXXX”表示特定年份的索引,“YYYY”表示年份。注释文件包含对象类别和在图像中的边界框(Bounding Box,BB)坐标。类别“0”对应类水雷接触物(MILCO)对象,类别“1”对应非水雷类海底物体(NOMBO)对象。边界框的表示方式如下图所示,绝对的对象BB坐标(x, y, w, h)可以通过以下关系获得:其中x, y是图像中BB的绝对坐标,w, h是其绝对宽度和高度。这种表示方式遵循YOLO(You Only Look Once)目标检测深度神经网络的标准格式,注释可以使用LabelImg等常用的图形图像注释工具轻松验证。也可以使用LabelImg将注释转换为PASCAL VOC、ImageNet或CreateML格式。下图展示了每年注释图像的示例,显示了注释过程的复杂性。
在这里插入图片描述
在这里插入图片描述
为了使用提供的数据集进行初步的目标检测,我们实现了YOLO v4算法。通过修改原始的“yolov4.cfg”文件,我们将批量大小(每次训练迭代中使用的样本数量)设置为64,子分块(训练批次的划分)设置为16,最大批次数(达到此值后训练停止)设置为6000,并在4800和5400批次时调整学习率(将其乘以0.1)。我们还将网络的输入图像尺寸设置为512×512像素,以优化检测精度。作为初步实现,我们使用在COCO数据集上预训练的权重文件“yolo4.conv.137”进行迁移学习。在此初步测试中,使用包含1170张图像的数据集,在前5000次训练迭代中,我们实现了平均交并比(IoU)60%,平均精度(AP)75%,精度82%,召回率64%,置信度阈值为0.25。所有相关文件,包括最终的训练权重“yolov4-custom_5000.weights”和包含一些实现说明的Jupyter Notebook示例“Real_time_object_classifier.ipynb”,都在数据集存储库中的名为“Training.zip”的单独文件中提供。值得注意的是,此实现提供了一个用于初始目标检测训练的基本算法。通过详细调整和优化模型参数和训练过程,可以实现显著更好的结果。
在这里插入图片描述

4. 实验设计、材料与方法

如前所述,数据集是使用Teledyne Marine Gavia自主水下航行器(AUV)上配备的900–1800 kHz Marine Sonic双频侧扫声呐采集的,如图6所示。该航行器由多个直径200毫米的模块组成,这些模块可以根据不同的AUV任务进行适配。航行器的重量范围为48至100公斤,尺寸可在1.7至3米之间变化。该航行器的最大作业深度为200米,最高航速为5节。除前述侧扫声呐外,航行器还配备有全球定位系统(GPS)、惯性导航系统以及一台高分辨率摄像机。

局限性
在数据领域,特别是在图像处理方面,图像数量越多,对于算法的应用和开发就越有利。该数据集包含1170张侧扫声呐图像,对于某些应用和算法开发来说,可能数量较少,存在一定局限性

伦理声明
作者确认当前工作不涉及人体试验、动物实验或来自社交媒体平台的数据采集,符合《Data in Brief》发表的所有伦理要求。

数据可用性
侧扫声呐成像用于水雷探测(原始数据)(Figshare)。

CRediT作者声明

Nuno Pessanha Santos:概念化、验证、正式分析、原始草稿撰写、审稿与编辑、可视化、监督、项目管理、资金获取;
Ricardo Moura:概念化、方法学、验证、正式分析、数据管理、审稿与编辑、可视化、监督、项目管理、资金获取;
Gonçalo Sampaio Torgal:方法学、软件开发、验证、正式分析、资源管理、数据管理、可视化;
Victor Lobo:概念化、项目管理、资金获取;
Miguel de Castro Neto:项目管理、资金获取。
致谢
本工作得到国家项目 MArIA - Plataforma Integrada de desenvolvimento de modelos de Inteligência artificial para o mar 的支持,资助编号为 POCI-05-5762-FSE-000400。Ricardo Moura 的研究工作得到了 Fundação para a Ciência e a Tecnologia (FCT) - Center for Mathematics and Applications (NOVA Math) 在 UIDB/00297/2020 (https://doi.org/10.54499/UIDB/00297/2020) 和 UIDP/00297/2020 (https://doi.org/10.54499/UIDP/00297/2020) 项目下的资助。Victor Lobo 和 Miguel de Castro Neto 的研究工作则通过 FCT 国家基金在项目 UIDB/04152/2020 - Centro de Investigação em Gestão de Informação (MagIC)/NOVA IMS 的支持下开展。

利益冲突声明
作者声明,他们没有已知的可能影响本文所报告工作的竞争性经济利益或个人关系


http://www.kler.cn/a/583355.html

相关文章:

  • Deepin通过二进制方式升级部署高版本 Docker
  • c语言 结构体对齐
  • 2020年蓝桥杯第十一届CC++大学B组(第一次)真题及代码
  • WPF 与 GMap.NET 结合实现雷达目标动态显示与地图绘制
  • JVM常用概念之常量
  • 【MySQL基础-3.1】MySQL DDL 语句详解:数据库操作篇
  • sql语句分页的关键字是?
  • 什么是 React 的合成事件?
  • paimon---同步mysql数据到paimon表中
  • uv python包管理工具
  • [极客大挑战 2019]FinalSQL【SQL布尔盲注】
  • Ubuntu 使用快速入门 | Android Framework
  • 电机控制常见面试问题(九)
  • 用TypeScript和library needle来创建视频爬虫程序
  • 使用AI一步一步实现若依前端(6)
  • 【每日学点HarmonyOS Next知识】路由栈问题、图片圆角、颜色资源转十六进制字符串、数据集变化崩溃、组件声明周期
  • Qt | 屏幕截图实现
  • deepseek的regflow安装mac版本
  • 【反无人机目标检测数据集】MIDGARD:关于基于机器学习的微型无人机视觉相对定位的训练数据集
  • 简述你对 Spring MVC 的理解