当前位置：首页 > article >正文

深度学习-模型调试经验总结

article 2025/2/6 11:59:57

1、
在这里插入图片描述这句话的意思是：期望张量的后端处理是在cpu上，但是实际是在cuda上。排查代码发现，数据还在cpu上，但是模型已经转到cuda上，所以可以通过把数据转到cuda上解决。
解决代码：

tensor.to("cuda")

2、
在这里插入图片描述解决方法：减小batch size的大小或减小图片的尺寸
3、

在这里插入图片描述原始的代码如下：

torch.save(model.module.state_dict(), os.path.join(model_prefix, '{}-model.pth'.format(epoch)))

原因：因为只有一块GPU，以上代码是多GPU使用的
解决方法：改为以下单GPU代码：

        meta = {}
        checkpoint = {"meta": meta, "state_dict": weights_to_cpu(model.state_dict())}
        if optimizer is not None:
            checkpoint["optimizer"] = optimizer.state_dict()
        torch.save(checkpoint, os.path.join(model_prefix, '{}-model.pth'.format(epoch)))

http://www.kler.cn/a/150242.html

相关文章：

专业学习｜一文了解并实操自适应大邻域搜索（讲解代码）

每日一题洛谷P5721 【深基4.例6】数字直角三角形c++

解决threeJS加载obj gltf和glb模型后颜色太暗的方法

8.原型模式(Prototype)

Windows图形界面(GUI)-QT-C/C++ - QT MDI Area

JavaScript模块化

java实现连接linux（上传文件，执行shell命令等）

Linux系列：Linux上杀毒软件有哪些?

【HarmonyOS】ArkUI状态管理：组件内状态、装饰器、高级用法与最佳实战【鸿蒙专栏-08】

用代码评论代替代码注释

.net core 连接数据库，通过数据库生成Modell

目标检测YOLO系列从入门到精通技术详解100篇-【目标检测】机器视觉（基础篇）（七）

美团YOLOv6量化部署实战方案

数据库其它调优策略

【Openstack Train安装】四、MariaDB/RabbitMQ 安装

深度学习毕设项目深度学习 python opencv 动物识别与检测

Linux 基本语句_13_消息队列

Arduino驱动SHT4x温湿度传感器（温湿度传感器）

Python内置函数与标准库函数的详细解读

Kubernetes - Pod 拉取镜像报错 ImagePullBackOff

【从浅识到熟知Linux】基本指令之rmdir和rm

leetcode 15. 三数之和

如何快速生成项目目录结构树？

flink源码分析之功能组件(四)-slotpool组件II

基于minio，上传sql文件后，使用通用查询接口查询并返回

数据结构-02-链表