当前位置: 首页 > article >正文

岩石分类检测数据集 4700张 岩石检测 带标注 voc yolo 9类

  

岩石分类检测数据集 4700张 岩石检测 带标注 voc yolo 9类

岩石分类检测数据集 (Rock Classification and Detection Dataset)

描述: 本数据集旨在支持对不同类型的岩石进行自动分类和检测,特别适用于地质勘探、矿物识别、环境监测等领域。通过使用该数据集训练的模型可以帮助及时发现并分类各种岩石类型,提高地质研究的效率和准确性。

类别:

  • Igneous_Basalt (火成岩 - 玄武岩)
  • Igneous_Diorite (火成岩 - 闪长岩)
  • Igneous_Granite (火成岩 - 花岗岩)
  • Metamorphic_Marble (变质岩 - 大理岩)
  • Metamorphic_Quartzite (变质岩 - 石英岩)
  • Sedimentary_Chalk (沉积岩 - 白垩)
  • Sedimentary_Coal (沉积岩 - 煤)
  • Sedimentary_Limestone (沉积岩 - 石灰岩)
  • Sedimentary_Sandstone (沉积岩 - 砂岩)

数据量:

  • 总图片数: 4,778张
  • 总标注个数: 16,085个
  • 每类详细信息:
    • Igneous_Basalt: 154张图片,659个标注
    • Igneous_Diorite: 467张图片,673个标注
    • Igneous_Granite: 168张图片,486个标注
    • Metamorphic_Marble: 713张图片,2,002个标注
    • Metamorphic_Quartzite: 924张图片,2,029个标注
    • Sedimentary_Chalk: 409张图片,1,019个标注
    • Sedimentary_Coal: 629张图片,3,548个标注
    • Sedimentary_Limestone: 699张图片,3,542个标注
    • Sedimentary_Sandstone: 615张图片,2,127个标注

标注格式:

  • VOC格式 (XML)
  • YOLO格式 (TXT)

文件格式:

  • 图像采用常见的JPEG或PNG格式。
  • 标注文件有两种格式:
    • VOC格式 (XML): 保存在annotations文件夹中,每个图像对应一个XML文件。
    • YOLO格式 (TXT): 保存在labels文件夹中,每个图像对应一个文本文件,其中包含边界框坐标及类别标签。例如,对于Igneous_Basalt类别的标注,文本文件中的每一行将按照以下格式表示:<class_id> <x_center> <y_center> <width> <height>,其中<class_id>为0到8(代表不同的岩石类别),其余参数均为归一化后的浮点数值。

数据集结构

确保您的数据集目录结构如下所示(这只是一个示例结构,您可以根据实际情况调整):

rock_classification_dataset/
├── images/
│   ├── train/
│   │   ├── img1.jpg
│   │   ├── img2.jpg
│   │   └── ...
│   ├── val/
│   │   ├── img3000.jpg
│   │   ├── img3001.jpg
│   │   └── ...
├── labels/
│   ├── train/
│   │   ├── img1.txt
│   │   ├── img2.txt
│   │   └── ...
│   ├── val/
│   │   ├── img3000.txt
│   │   ├── img3001.txt
│   │   └── ...
├── annotations/
│   ├── train/
│   │   ├── img1.xml
│   │   ├── img2.xml
│   │   └── ...
│   ├── val/
│   │   ├── img3000.xml
│   │   ├── img3001.xml
│   │   └── ...
└── data.yaml

data.yaml 配置文件

创建一个名为 data.yaml 的配置文件,内容如下:

train: ./rock_classification_dataset/images/train
val: ./rock_classification_dataset/images/val

nc: 9  # 类别数量
names: ['Igneous_Basalt', 'Igneous_Diorite', 'Igneous_Granite', 'Metamorphic_Marble', 'Metamorphic_Quartzite', 'Sedimentary_Chalk', 'Sedimentary_Coal', 'Sedimentary_Limestone', 'Sedimentary_Sandstone']  # 类别名称

使用方法

1. 准备环境

确保安装了必要的Python库,如ultralytics(用于YOLOv8)和其他相关依赖:

pip install ultralytics
2. 修改配置文件

根据实际路径修改 data.yaml 文件中的路径。

3. 训练脚本

以下是一个使用YOLOv8进行训练的Python脚本示例:

from ultralytics import YOLO
import torch

# 设置设备
device = 'cuda' if torch.cuda.is_available() else 'cpu'

# 加载预训练模型或从头开始训练
model = YOLO('yolov8n.pt')  # 使用预训练的YOLOv8n模型
# model = YOLO()  # 从头开始训练

# 开始训练
results = model.train(
    data='path/to/data.yaml',  # 指定数据集配置文件路径
    epochs=100,  # 训练轮次
    batch=16,  # 批处理大小
    imgsz=640,  # 输入图像尺寸
    workers=8,  # 数据加载线程数
    device=device,  # 使用GPU设备编号,默认为0
    project='rock_classification',  # 保存结果的项目名称
    name='exp',  # 实验名称
    exist_ok=True  # 如果存在相同实验名,覆盖旧的结果
)

# 可视化训练结果
results.plot()

# 保存模型
model.save('rock_classification_model.pt')

训练结果

模型: YOLOv8

性能指标:

  • 准确率 (Accuracy): [根据实际结果填写]
  • 精确度 (Precision): [根据实际结果填写]
  • 召回率 (Recall): [根据实际结果填写]
  • F1分数 (F1 Score): [根据实际结果填写]
  • 平均精度均值 (mAP@0.5:0.95): [根据实际结果填写]

模型文件:

  • 提供了YOLOv8的预训练模型文件,可以直接用于推理或进一步微调。

总结

这个岩石分类检测数据集提供了4,778张高质量的真实场景图片,并且已经使用VOC和YOLO两种格式进行了标注。数据集涵盖了九种不同的岩石类别,包括火成岩、变质岩和沉积岩等常见类型。通过使用YOLOv8框架,可以有效地识别和分类这些岩石。提供的预训练模型可以在实际应用中提供可靠的检测结果。

特点

  1. 多样性:

    • 包含多种不同类型的岩石,覆盖了常见的地质样本。
    • 图像采集自真实场景,具有较高的多样性和实用性。
  2. 标注质量:

    • 图像采用高质量的标注,包括边界框和类别标签。
    • 提供VOC和YOLO两种格式的标注文件,方便在不同的深度学习框架中使用。
  3. 规模适中:

    • 4,778张图像的数据集规模适中,既足够训练模型,又不会导致过长的训练时间。
  4. 可扩展性:

    • 数据集可以进行扩充,以增加更多图像数据,提高模型的泛化能力。

示例UI界面设计

如果您需要开发一个上位机软件来进行实时的岩石分类检测,可以参考以下简单的Tkinter GUI示例:

import tkinter as tk
from tkinter import filedialog
from PIL import Image, ImageTk
import cv2
import torch
from ultralytics import YOLO

# 加载预训练模型
model = YOLO('rock_classification_model.pt')

def load_image():
    global image_path
    image_path = filedialog.askopenfilename()
    if image_path:
        image = Image.open(image_path)
        image = image.resize((640, 480))
        photo = ImageTk.PhotoImage(image)
        image_label.config(image=photo)
        image_label.image = photo

def detect_objects():
    if image_path:
        # 读取图像
        image = cv2.imread(image_path)
        results = model(image)

        # 绘制检测结果
        for result in results:
            boxes = result.boxes
            for box in boxes:
                x1, y1, x2, y2 = map(int, box.xyxy[0])
                label = model.names[int(box.cls)]
                confidence = float(box.conf)
                color = (0, 255, 0)  # 绿色
                cv2.rectangle(image, (x1, y1), (x2, y2), color, 2)
                cv2.putText(image, f'{label} {confidence:.2f}', (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)

        # 显示检测结果
        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        image = Image.fromarray(image)
        image = image.resize((640, 480))
        photo = ImageTk.PhotoImage(image)
        image_label.config(image=photo)
        image_label.image = photo

# 创建主窗口
root = tk.Tk()
root.title("Rock Classification and Detection")

# 图像显示区域
image_label = tk.Label(root)
image_label.pack(pady=20)

# 按钮
load_button = tk.Button(root, text="Load Image", command=load_image)
load_button.pack(side=tk.LEFT, padx=10)

detect_button = tk.Button(root, text="Detect Objects", command=detect_objects)
detect_button.pack(side=tk.RIGHT, padx=10)

# 运行主循环
root.mainloop()

这个示例展示了如何使用Tkinter构建一个简单的GUI,允许用户加载图像并进行岩石分类检测。您可以根据需要进一步扩展和完善这个界面,添加更多的功能和优化用户体验。


http://www.kler.cn/a/354577.html

相关文章:

  • 如何在 Ubuntu 22.04 上安装 Cassandra NoSQL 数据库教程
  • C++语言的并发编程
  • 力扣经典题目之219. 存在重复元素 II
  • MATLAB对文件处理
  • Selenium 八大元素定位方法及场景扩展
  • IP查询于访问控制保护你我安全
  • 2024系统架构师---试题二论软件架构的脆弱性
  • Linux·进程控制
  • 【贪心算法】(第一篇)
  • OpenShift 4 - 云原生备份容灾 - Velero 和 OADP 基础篇
  • 《案例》—— OpenCV 实现2B铅笔填涂的答题卡答案识别
  • MeshGS: Adaptive Mesh-Aligned GaussianSplatting for High-Quality Rendering 论文解读
  • 公司新来一个同事,把枚举运用得炉火纯青...
  • 【Flutter】Dart:库
  • 文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《计及配电线路脆弱性的电动汽车充放电时空分布优化策略》
  • day46|72. 编辑距离647. 回文子串516.最长回文子序列 5 最长回文子串
  • vue3 使用 Vue Router实现前端路由控制
  • 【Echarts动态排序图,series使用背景色更新动画,背景底色不同步跟随柱子动画】大家有没有解决方案
  • 遥感技术助力生态系统碳储量、碳收支、碳循环等多领域监测与模拟:森林碳储量,城市扩张,夜间灯光数据,陆地生态系统,大气温室气体监测等
  • 轻量级可视化数据分析报表,分组汇总表!
  • MySQL—关于数据库的CRUD—(增删改查)
  • Vue——Uniapp回到顶部悬浮按钮
  • TS和JS中,string与String的区别
  • 【VUE】Vue中的data属性为什么是一个函数而不是一个对象
  • 机器学习:opencv--光流估计
  • 一文探索RareShop:首个面向消费者的RWA NFT商品发售平台