当前位置: 首页 > article >正文

YOLO系列入门:1、YOLO V11环境搭建

YOLO了解

yolo检测原理

  • yolo是目标检测模型,目标检测包含物体分类、位置预测两个内容。目前yolo的开发公司官网为:https://docs.ultralytics.com/zh
  • 截止到目前2024年10月,最新的是yolo11
  • 关于YOLO的介绍可以参考这篇文章:https://zhuanlan.zhihu.com/p/94986199
  • 总结一下文章内容:
    • YOLO是region-free的方法,在此之前的R-CNN是region-based方法,yolo优点是更快,不需要分两步。
    • yolo在检测时,将一个图片分为多个grid,然后每个grid预测B个边界框,要求边界框中心点位于改grid内,同时预测边界框的长和宽。对于一个物体位于多个grid的情况,通过计算置信度,由于实际物体位于中心的grid交并比肯定最大,因此可以删除其余包含

  • 关于yolo不同版本的综区别述介绍可以参考:https://blog.csdn.net/daydayup858/article/details/130018935
    • YOLO原本是在论文中提出的一个网络模型,由论文作者开发出了YOLO V1/2/3,而后由其他人和公司开发出了后来的YOLO V5、V10等版本。目前主流的是由 ultralytics 公司维护的YOLO,官网为:https://docs.ultralytics.com/zh

yolo环境搭建

  • 我们根据官网指导,搭建最新版的yolo v11开发环境。
  • 由于我们之前使用Conda安装了Pytorch和CUDA,因此我们这里依然选用Conda进行YOLO的安装。当然也可以通过docker进行安装。
  • 首先,我们按照我们之前的文章1、Pytorch框架搭建安装好Pytorch开发环境。
  • 我们将原本安装Pytorch的环境克隆一份,创建YOLO11新环境。注意:克隆环境并不会克隆pytorch,Conda采用的是硬链接的方式。(假的,被骗了。发现整整复制了5个G)
  • 我们在原本Pytorch的环境中,执行以下命令安装YOLO 11:
    pip install ultralytics
    
    在这里插入图片描述
  • 安装好后,测试安装成功。
    在这里插入图片描述

测试目标检测模型

  • YOLO支持CLI操作,不需要写python代码,就可以直接使用命令行指挥YOLO进行识别。图片如下:810*1080
    在这里插入图片描述

  • 首先,我们新建一个空白文件夹,将我们要识别的图片放进去。如下:
    在这里插入图片描述

  • 然后在conda中用命令行切换到该文件夹。将图片路径传给YOLO,执行命令

    yolo predict model=yolo11n.pt source='bus.jpg' device=0
    
  • 可以看到,这里使用的模型yolov11n.pt是预训练好的模型,YOLO会去github仓库上下载该模型。在这里插入图片描述

  • 对于YOLO 的每个版本,都会有官方版的几个预训练模型,这些模型是在COCO数据集上训练的,包含了33万张图片,涵盖了常见的80个常见物体类别。不同模型的大小参数如下:
    在这里插入图片描述

  • 可以看到执行后的文件夹内容如下:
    在这里插入图片描述

    • 其中yolov11n.pt是我们下载下来的网络模型。这里我测试运行了多个模型,因此有多个模型文件。
    • 而runs/detect/predict文件夹下面保存的是模型识别的结果:
      在这里插入图片描述
  • 最终识别结果如下,说明我们成功配置好了YOLO环境。
    在这里插入图片描述

  • 在实际项目中,我们不会通过CLI调用YOLO,而是会通过python脚本调用YOLO,原理相同。

参考

Conda安装YOLO
COCO数据集介绍


http://www.kler.cn/a/355026.html

相关文章:

  • 高级的SQL查询技巧有哪些?
  • java全栈day19--Web后端实战(java操作数据库3)
  • 深度学习0-前置知识
  • 贪心算法 part01
  • ubuntu22.04 nginx配置下载目录,亲测成功
  • Android 蓝牙Bluedroid线程池设计思路介绍
  • python中不变的数据类型有哪些
  • 使用 nrm 管理 npm 镜像源
  • 0基础学Java之Day09(上午完整版)
  • 从零开始了解云WAF,您的网站安全升级指南
  • 直播美颜平台架构设计:基于视频美颜SDK的开发实践
  • 微信小程序引入组件教程
  • 通过比较list与vector在简单模拟实现时的不同进一步理解STL的底层
  • 标准C库总结
  • 第1节 入门
  • WLAN技术
  • 【前端】Matter:基础概念与入门
  • 基于51单片机的PID直流电机调速系统(程序+Proteus仿真+报告+原理图)
  • Rider + xmake DX12 开发环境
  • 【AAOS】Android Automotive 15模拟器源码下载及编译
  • tensorRT安装详解(linux与windows)
  • Redis总结(官方文档解读)
  • 【工具篇】MLU运行XInference部署手册
  • 安全见闻笔记
  • 春日学习伴侣:Spring Boot答疑平台
  • 03.顺序表实现