当前位置: 首页 > article >正文

深度学习-模型调试经验总结

1、
在这里插入图片描述这句话的意思是:期望张量的后端处理是在cpu上,但是实际是在cuda上。排查代码发现,数据还在cpu上,但是模型已经转到cuda上,所以可以通过把数据转到cuda上解决。
解决代码:

tensor.to("cuda")

2、
在这里插入图片描述解决方法:减小batch size的大小或减小图片的尺寸
3、

在这里插入图片描述原始的代码如下:

torch.save(model.module.state_dict(), os.path.join(model_prefix, '{}-model.pth'.format(epoch)))

原因:因为只有一块GPU,以上代码是多GPU使用的
解决方法:改为以下单GPU代码:

        meta = {}
        checkpoint = {"meta": meta, "state_dict": weights_to_cpu(model.state_dict())}
        if optimizer is not None:
            checkpoint["optimizer"] = optimizer.state_dict()
        torch.save(checkpoint, os.path.join(model_prefix, '{}-model.pth'.format(epoch)))

http://www.kler.cn/a/150242.html

相关文章:

  • 「Mac畅玩鸿蒙与硬件15」鸿蒙UI组件篇5 - Slider 和 Progress 组件
  • GO语言基础(三)
  • DFS求解迷宫最长移动路线
  • ubuntu22.04安装conda
  • WSL开发--利用Git连接远程仓库(详细步骤)
  • go 聊天系统项目-1
  • java实现连接linux(上传文件,执行shell命令等)
  • Linux系列:Linux上杀毒软件有哪些?
  • 【HarmonyOS】ArkUI状态管理:组件内状态、装饰器、高级用法与最佳实战【鸿蒙专栏-08】
  • 用代码评论代替代码注释
  • .net core 连接数据库,通过数据库生成Modell
  • 目标检测YOLO系列从入门到精通技术详解100篇-【目标检测】机器视觉(基础篇)(七)
  • 美团YOLOv6量化部署实战方案
  • 数据库其它调优策略
  • 【Openstack Train安装】四、MariaDB/RabbitMQ 安装
  • 深度学习毕设项目 深度学习 python opencv 动物识别与检测
  • Linux 基本语句_13_消息队列
  • Arduino驱动SHT4x温湿度传感器(温湿度传感器)
  • Python内置函数与标准库函数的详细解读
  • Kubernetes - Pod 拉取镜像报错 ImagePullBackOff
  • 【从浅识到熟知Linux】基本指令之rmdir和rm
  • leetcode 15. 三数之和
  • 如何快速生成项目目录结构树?
  • flink源码分析之功能组件(四)-slotpool组件II
  • 基于minio,上传sql文件后,使用通用查询接口查询并返回
  • 数据结构-02-链表