当前位置: 首页 > article >正文

YOLO系列再创新高:迎接YOLO11的到来!

导读

        YOLO(You Only Look Once)是一个著名的物体检测和图像分割模型,自其首次亮相以来,便在计算机视觉领域引起了巨大关注。以下是YOLO系列各版本的简洁介绍:

  • YOLOv1:开启目标检测新纪元
  • YOLOv2:多样性和扩展性
  • YOLOv3:更强大的特征提取能力
  • YOLOv4:效率和精度的平衡
  • YOLOv5:简洁与高效并存
  • YOLOv6:持续优化与升级
  • YOLOv7:速度与精度的双重增强
  • YOLOv8:视觉AI任务的高适配
  • YOLOv9:梯度信息的充分利用
  • YOLOv10:实时端到端目标检测

关于YOLO11

        YOLO11是在今年早些时候发布的YOLOv9和YOLOv10基础上发展而来的,它融合了优化后的架构设计、强化的特征抽取技术以及精进的训练策略。

        YOLO11真正引人注目的是其卓越的速度和精确度,与效率相结合,这使得它成为了Ultralytics所开发出的最为强劲的版本之一。凭借这些改进,YOLO11能够更加高效地从图像中提取关键模式和细节,在面对复杂场景时依然能够保持较高的识别准确性。

图1. 使用YOLO11进行目标检测

YOLO11性能对比

        相比之前的版本,YOLO11在架构设计和训练策略上实现了显著的优化,从而提升了整体性能。如下方的图表所示,YOLO11与YOLOv10、YOLOv9等前代版本在延迟和检测平均精度(mAP)方面进行了全面对比。YOLO11在维持低延迟的同时,显著提高了检测精度,展现出卓越的性能平衡,这使得它更加适合应用于多样化的计算机视觉任务,特别是在那些对实时性要求较高的推理场景中表现突出。更为重要的是,YOLO11的优化使得即便在计算资源受限的情况下,它仍能保持高效的性能输出,这一点使其尤为适合在边缘计算设备以及云端服务器上进行高效推理应用。

图2. YOLO系列各版本在不同延迟下的性能比较

YOLO11主要特点

  1. 优化效率与速度:YOLO11 通过精心设计的架构和高效的训练策略,提升了处理速度,并在准确率与性能间达到最优平衡。
  1. 改进的特征提取:YOLO11 使用优化的骨干网络和颈部结构,提高了特征提取的效能,从而实现更精准的目标检测及复杂任务处理。    
  1. 更少参数更高精度:凭借设计上的进步,YOLO11 在 COCO 数据集上获得了更高的 mAP 值,相较于 YOLOv8m 减少了 22% 的参数量,在保证计算效率的同时维持了高水平的准确性。
  1. 多环境兼容性:YOLO11 支持在不同环境下无间断部署,如边缘设备、云端服务器或 NVIDIA GPU 平台,确保高度的灵活性。
  1. 多样化的应用支持:不论是目标检测、实例分割、图像分类、姿态估计还是定向目标检测,YOLO11 都能够胜任各类计算机视觉任务。

图3. YOLO11支持的视觉任务

        每种特定的视觉任务都配备了专门的模型文件,例如yolo11n.ptyolo11m-seg.pt,这些模型不仅内置了推理、验证、训练以及导出等多种功能,而且针对各自的任务特点进行了深度优化。

        这种精细化的模型分配策略使得我们能够根据不同的应用场景和需求,灵活地选择并部署相应的YOLO11模型。例如,当处理目标检测任务时,我们可以运用YOLO11进行精确识别;而在需要进行图像分割的场合,YOLO11-seg模型则能够提供更加细致的区域划分能力,以满足复杂场景下的处理需求。

图4. YOLO11系列模型在不同任务中的应用及支持功能

YOLO11新特性及应用场景

  • 图像分类:简化整图分类流程,便于电子商务商品归类和野生动植物监测。
  • 目标检测:提供更准确的边界框定位,适用于监控系统、自动驾驶汽车及零售业分析。

图5. 目标检测的性能指标

  • 实例分割:能够精确区分图像内的各个单独对象,适用于医疗图像分析和工业质量检测。
  • 旋转框检测:准确定位旋转目标,特别适合于航拍图像、机器人技术及仓储自动化领域。
  • 姿态估计:可靠地标记关键点,为健身活动追踪、体育表现分析及医疗健康应用开辟新途径。
  • 目标跟踪:实现跨帧的对象监测与跟踪,为多种需要即时处理的应用提供重要支撑。

YOLO11简单的训练和推理示例

        以下示例是适用于对象检测的 YOLO11 模型。简单来说,这次更新的YOLO11模型是在YOLOv8基础上开发的,其网络结构基本保持不变,只需要改变一下加载模型的配置。

Python
from ultralytics import YOLO
 
# Load a model
model = YOLO("yolo11n.pt")
 
# Train the model
train_results = model.train(
    data="coco8.yaml",  # path to dataset YAML
    epochs=100,  # number of training epochs
    imgsz=640,  # training image size
    device="cpu",  # device to run on, i.e. device=0 or device=0,1,2,3 or device=cpu
)
 
# Evaluate model performance on the validation set
metrics = model.val()
 
# Perform object detection on an image
results = model("path/to/image.jpg")
results[0].show()
 
# Export the model to ONNX format
path = model.export(format="onnx")  # return path to exported model

        YOLO11作为新一代的计算机视觉模型,以其卓越的性能和多功能性在目标检测与图像分割领域脱颖而出。该模型通过精心设计的网络结构和参数优化,实现了快速、准确的物体识别。同时,YOLO11系列提供了多种专门化的模型文件,以适应不同的应用场景,确保了在实际应用中的灵活性与高效性。无论是在安全监控、自动驾驶,还是工业自动化等领域,YOLO11都能为用户提供稳定可靠的视觉分析解决方案,推动人工智能技术在各行业的深入应用。


http://www.kler.cn/a/378778.html

相关文章:

  • 为什么我们调用 start()方法时会执行 run()方法 ,为什么我们不能 直接调用 run()方法?
  • 鸿蒙进阶-AlphabetIndexer组件
  • Java环境下配置环境(jar包)并连接mysql数据库
  • 人工智能原理实验一:知识的表示与推理实验
  • 力扣排序350题 两个元组的交集2
  • Android 使用ninja加速编译的方法
  • 再探“构造函数”(2)友元and内部类
  • 机器学习-理论学习
  • 第三十四篇:URL和URI的区别,HTTP系列一
  • 实时监控工作状态!这八款电脑监控软件助你提升效率!
  • Django+Vue全栈开发项目入门(四)
  • 【自动化更新,让商品信息跳舞】——利用API返回值的幽默编程之旅
  • 记录|SQL中日期查询出现的问题
  • 【k8s】-Pod镜像拉取失败问题
  • 为什么 jsp request.getParameter报红,但启动正常?原因在于tomcat内置lib
  • 六、k8s快速入门之容器探针
  • npm入门教程8:缓存管理
  • Swarm-LIO: Decentralized Swarm LiDAR-inertial Odometry论文翻译
  • sed提示不能识别 / 符号
  • 电子电气架构 --- 车载诊断的快速入门
  • 后端java——如何为你的网页设置一个验证码
  • 一些swift问题
  • (新)docker desktop镜像迁移
  • 数据结构 —— 红黑树
  • doris监控
  • Conmi的正确答案——在Kibana中进入Elasticsearch的索引管理页面