当前位置: 首页 > article >正文

【yolov8】模型导出----pytorch导出为onnx模型

【yolov8】模型导出

  • 一、为什么要使用yolo的导出模式
  • 二、确保安装必要的库:
  • 三、yolov8模型导出
    • 3.1 不同格式配置参数
    • 3.2 导出格式
  • 四、导出模型性能优化
    • 4.1 使用TensorRT 导出模型有什么好处?
    • 4.2导出YOLOv8 模型时,如何启用 INT8 量化?
    • 4.3 为什么输出模型时动态输入尺寸很重要?
    • 4.4 优化模型性能需要考虑哪些关键的导出参数?
  • 五、问题
  • 六、疑问

训练模型的最终目标是将其部署到实际应用程序中。Ultralytics YOLOv8 中的导出模式提供了多种选项,用于将训练后的模型导出为不同的格式,使其可部署在各种平台和设备上。本综合指南旨在引导您了解模型导出的细微差别,展示如何实现最大的兼容性和性能。

一、为什么要使用yolo的导出模式

  • 多面性:导出为多种格式,包括 ONNX、TensorRT、CoreML 等
  • 性能:使用 TensorRT 获得高达 5 倍的 GPU 加速,使用 ONNX 或 OpenVINO 获得 3 倍的 CPU 加速。
  • 兼容性:使您的模型可在众多硬件和软件环境中普遍部署。
  • 易用性:简单的 CLI 和 Python API,用于快速直接的模型导出。

二、确保安装必要的库:

确保你已经安装了PyTorch和ONNX库。可以使用以下命令安装:

pip install torch torchvision onnx

三、yolov8模型导出

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom trained model

# Export the model
model.export(format="onnx")
# 使用cli命令
yolo export model=yolov8n.pt format=onnx  # export official model
yolo export model=path/to/best.pt format=onnx  # export custom trained model

3.1 不同格式配置参数

下表详细介绍了将YOLO 模型导出为不同格式时可用的配置和选项。这些设置对于优化导出模型的性能、大小以及在不同平台和环境中的兼容性至关重要。正确的配置可确保模型以最佳效率部署到预定应用中。

论据类型默认值说明
formatstr'torchscript'导出模型的目标格式,例如 'onnx', 'torchscript', 'tensorflow'或其他,定义与各种部署环境的兼容性。
imgszinttuple640模型输入所需的图像尺寸。对于正方形图像,可以是一个整数,或者是一个元组 (height, width) 了解具体尺寸。
kerasboolFalseEnables export to Keras format for TensorFlow SavedModel, providing compatibility with TensorFlow serving and APIs.
optimizeboolFalse在导出到TorchScript 时,应用针对移动设备的优化,可能会减小模型大小并提高性能。
halfboolFalse启用 FP16(半精度)量化,在支持的硬件上减小模型大小并可能加快推理速度。
int8boolFalseActivates INT8 quantization, further compressing the model and speeding up inference with minimal accuracy loss, primarily for edge devices.
dynamicboolFalse允许为ONNX 、TensorRT 和OpenVINO 导出动态输入尺寸,提高了处理不同图像尺寸的灵活性。
simplifyboolTrue简化模型图 ONNX 导出方式 onnxslim,可能会提高性能和兼容性。
opsetintNone指定ONNX opset 版本,以便与不同的ONNX 解析器和运行时兼容。如果未设置,则使用最新的支持版本。
workspacefloat4.0为TensorRT 优化设置最大工作区大小(GiB),以平衡内存使用和性能。
nmsboolFalse在CoreML 导出中添加非最大值抑制 (NMS),这对精确高效的检测后处理至关重要。
batchint1指定导出模型的批量推理大小,或导出模型将同时处理的图像的最大数量。 predict 模式。

3.2 导出格式

YOLOv8 可用的导出格式如下表所示。您可以使用 format 参数,即 format='onnx'format='engine'.您可以直接对导出的模型进行预测或验证,即 yolo predict model=yolov8n.onnx.导出完成后会显示模型的使用示例。

Format格式format ArgumentModel 模型MetadataArguments
PyTorch-yolov8n.pt-
TorchScripttorchscriptyolov8n.torchscriptimgsz, optimize, batch
ONNXonnxyolov8n.onnximgsz, half, dynamic, simplify, opset, batch
OpenVINOopenvinoyolov8n_openvino_model/imgsz, half, int8, batch
TensorRTengineyolov8n.engineimgsz, half, dynamic, simplify, workspace, int8, batch
CoreMLcoremlyolov8n.mlpackageimgsz, half, int8, nms, batch
TF SavedModelsaved_modelyolov8n_saved_model/imgsz, keras, int8, batch
TF GraphDefpbyolov8n.pbimgsz, batch
TF Litetfliteyolov8n.tfliteimgsz, half, int8, batch
TF Edge TPUedgetpuyolov8n_edgetpu.tfliteimgsz
TF.jstfjsyolov8n_web_model/imgsz, half, int8, batch
PaddlePaddlepaddleyolov8n_paddle_model/imgsz, batch
NCNNncnnyolov8n_ncnn_model/imgsz, half, batch

四、导出模型性能优化

4.1 使用TensorRT 导出模型有什么好处?

使用TensorRT 导出模型可显著提高性能。YOLOv8 导出到TensorRT 的模型速度最高可达GPU 的 5 倍,是实时推理应用的理想选择。

  • **多功能性:**针对特定硬件设置优化模型。
  • **速度:**通过高级优化实现更快的推理。
  • **兼容性:**可与NVIDIA 硬件顺利集成。

4.2导出YOLOv8 模型时,如何启用 INT8 量化?

INT8 量化是压缩模型和加快推理速度的绝佳方法,尤其是在边缘设备上。下面介绍如何启用 INT8 量化:

示例

from ultralytics import YOLO

model = YOLO("yolov8n.pt")  # Load a model
model.export(format="onnx", int8=True)
yolo export model=yolov8n.pt format=onnx int8=True   # export model with INT8 quantization

4.3 为什么输出模型时动态输入尺寸很重要?

动态输入尺寸允许导出的模型处理不同的图像尺寸,为不同的使用案例提供灵活性并优化处理效率。在导出为ONNX 或TensorRT 等格式时,启用动态输入尺寸可确保模型能无缝适应不同的输入形状。

要启用此功能,使用 dynamic=True 标志:

from ultralytics import YOLO

model = YOLO("yolov8n.pt")
model.export(format="onnx", dynamic=True)
yolo export model=yolov8n.pt format=onnx dynamic=True

4.4 优化模型性能需要考虑哪些关键的导出参数?

了解和配置导出参数对于优化模型性能至关重要:

  • format: 导出模型的目标格式(例如:“…”)、 onnx, torchscript, tensorflow).
  • imgsz: 模型输入所需的图像大小(例如:“…”)、 640(height, width)).
  • half: 启用 FP16 量化,减少模型大小,并可能加快推理速度。
  • optimize: 针对移动或受限环境进行特定优化。
  • int8: 启用 INT8 量化,非常有利于边缘部署。

五、问题

当使用 dynamic=Truehalf=True 导出 .onnx 格式的模型时,可能会发生不兼容的问题

因为动态尺寸 (dynamic) 功能和半精度 (half) 可能会与某些 ONNX Runtime 版本或配置产生冲突。解决方案:

  1. 分开使用: 先尝试使用 dynamic=Falsehalf=True,看看是否能成功导出并验证模型。这样,你可以确定是否确实是动态和半精度之间的具体冲突。
  2. 使用最新 ONNX Runtime: 确保你的 ONNX Runtime 是最新版本,有时版本更新会解决这类问题。
  3. 不使用半精度导出: 试试仅用 dynamic=True 而不开启 half,以检查是否是半精度计算导致的问题。
yolo export model=your_model.pt format=onnx dynamic=True half=False

六、疑问

其他人对model进行修改,修改它的意义是什么??

# 直接使用Pytorch的保存功能,保存为PyTorch
import torch
from ultralytics import YOLO

# 加载模型
model = YOLO('path/to/your/model.pt')  # 加载您的.pt模型

# 进行您的模型修改
# model.xxx = ...

# 保存模型
torch.save(model.state_dict(), 'path/to/save/your_modified_model.pt')

从YOLOv8模型进行修改并导出为TorchScript(默认格式)

from ultralytics import YOLO

# 加载模型
model = YOLO('path/to/your/model.pt')

# 导出为TorchScript,默认不需要设置format参数
model.export('path/to/save/your_model.torchscript')

大佬写的onnx模型查看网络结构,以及修改onnx简化模型!!


http://www.kler.cn/a/329790.html

相关文章:

  • 算法(蓝桥杯)贪心算法7——过河的最短时间问题解析
  • PCL 新增自定义点类型【2025最新版】
  • 深入了解卷积神经网络(CNN):图像处理与深度学习的革命性技术
  • vue自适应高度(缩放浏览器)
  • 32单片机综合应用案例——基于GPS的车辆追踪器(三)(内附详细代码讲解!!!)
  • MySQL程序之:使用类似URI的字符串或键值对连接到服务器
  • windows美化终端
  • go结构体默认值和校验器(go-defaults、go-validator)
  • 【Redis】主从复制(下)--主从复制原理和流程
  • 【数据分享】2001-2023年我国省市县镇四级的逐月平均气温数据(免费获取/Shp/Excel格式)
  • ubuntu 安装kvm 创建windos虚拟机
  • AMD 矩阵核心
  • 搜维尔科技:使用Xsens动作捕捉系统和ai训练人形机器人模仿人类运动,执行复杂任务
  • docker环境下配置cerbot获取免费ssl证书并自动续期
  • java中有两个list列表,尽量少的去循环
  • 模版and初识vector
  • windows系统电脑上scrcpy源码本地调试
  • Java基础——十二、容器
  • 5G NR物理信号
  • git push 远程仓库 linux版
  • 爬虫——爬虫理论+request模块
  • 【Linux】进程周边之优先级
  • 陶建辉先生荣获 2024 年“中国计算机学会(CCF)杰出工程师奖”
  • Harbor系列之12:对接外部redis和pg数据库的harbor容器化部署
  • C++:采用模板封装顺序表,栈,队列
  • 秋招内推2025--招联金融