当前位置: 首页 > article >正文

ONNX模型部署利器ONNXRUNTIME框架

1.ONNXRUNTIME介绍

        ONNX格式模型部署兼容性最强的框架 ONNXRUNTIME,基本上不会有算子不支持跟不兼容的情况出现,只要能导出ONNX格式模型,它基本上都能成功加载,成功推理。虽然在CPU速度不及OpenVINO、GPU上速度不及TensorRT,但是胜在兼容性强,支持不同硬件上推理部署包括:ARM、CPU、GPU、AMD等,

 可以通过设置不同的推理后台支持,包括:

支持语言也非常丰富,不止于Python跟C++语言,支持列表如下:

 

支持的操作系统包括Windows、Android、乌班图、iOS等。

2.Python版本安装与测试

Python版本安装特别容易,一条命令行搞定

CPU版本

pip install onnxruntime

GPU版本

pip install onnxruntime-gpu

通过下面的API函数可以查询当前支持推理Provider,代码如下:

运行结果如下:

3.C++版本安装与测试

首先需要下载安装包,以 microsoft.ml.onnxruntime.gpu.1.13.1为例。首先需要配置包含目录

D:\microsoft.ml.onnxruntime.gpu.1.13.1\build\native\include

然后配置库目录:

D:\microsoft.ml.onnxruntime.gpu.1.13.1\runtimes\win-x64\native

最后配置链接器,我的是支持CUDA版本,配置如下:

onnxruntime_providers_shared.libonnxruntime_providers_cuda.libonnxruntime.lib

最后把DLL文件copy到编译生成的可执行文件同一个目录下,直接运行即可。C++推理,简单说分为四步,首先引入包含文件支持,再初始化推理会话对象Session,预处理图像,然后执行推理,最后完成后处理即可。

 

 以ResNet18模型为例,导出ONNX格式,基于ONNXRUNTIME推理效果如下:

 


http://www.kler.cn/a/317992.html

相关文章:

  • SQL,力扣题目1127, 用户购买平台
  • androidstudio下载gradle慢
  • Ceph 中Crush 算法的理解
  • Llama架构及代码详解
  • C#发票识别、发票查验接口集成、电子发票(航空运输电子行程单)
  • influxDB 时序数据库安装 flux语法 restful接口 nodjsAPI
  • 算法-Init
  • [sniffer]分析
  • Excel 冻结多行多列
  • Python机器学习基础(NumPy、Pandas、Matplotlib)
  • 【CPP11?】结合CPP发展历史来理解CPP11
  • 代码随想录算法训练营Day14 | 226.翻转二叉树、101. 对称二叉树、104.二叉树的最大深度、111.二叉树的最小深度
  • 【MySQL内置数据库】information_schema
  • 【C++】检测TCP链接超时——时间轮组件设计
  • 自学前端的正确姿势是...
  • 第17周 第2章Session与ServletContext原理 ---ServletContext与三大作用域对象
  • PerparedStatement概述
  • Qt 模型视图(三):视图类QAbstractItemView
  • Python常见Json对比库deepdiff、json_tools、jsonpatch
  • 【Python】curl命令、Api POST导入cURL、python直接使用cURL
  • OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【内核通信机制】下
  • 球体检测系统源码分享
  • Rust的作用?
  • tar.gz 文件压缩与解压shell实现
  • 付费电表系统的通用功能和应用过程参考模型(下)
  • 鸿蒙HarmonyOS开发:一次开发,多端部署(界面级)天气应用案例