当前位置: 首页 > article >正文

深度学习-模型调试经验总结

1、
在这里插入图片描述这句话的意思是:期望张量的后端处理是在cpu上,但是实际是在cuda上。排查代码发现,数据还在cpu上,但是模型已经转到cuda上,所以可以通过把数据转到cuda上解决。
解决代码:

tensor.to("cuda")

2、
在这里插入图片描述解决方法:减小batch size的大小或减小图片的尺寸
3、

在这里插入图片描述原始的代码如下:

torch.save(model.module.state_dict(), os.path.join(model_prefix, '{}-model.pth'.format(epoch)))

原因:因为只有一块GPU,以上代码是多GPU使用的
解决方法:改为以下单GPU代码:

        meta = {}
        checkpoint = {"meta": meta, "state_dict": weights_to_cpu(model.state_dict())}
        if optimizer is not None:
            checkpoint["optimizer"] = optimizer.state_dict()
        torch.save(checkpoint, os.path.join(model_prefix, '{}-model.pth'.format(epoch)))

http://www.kler.cn/news/150242.html

相关文章:

  • java实现连接linux(上传文件,执行shell命令等)
  • Linux系列:Linux上杀毒软件有哪些?
  • 【HarmonyOS】ArkUI状态管理:组件内状态、装饰器、高级用法与最佳实战【鸿蒙专栏-08】
  • 用代码评论代替代码注释
  • .net core 连接数据库,通过数据库生成Modell
  • 目标检测YOLO系列从入门到精通技术详解100篇-【目标检测】机器视觉(基础篇)(七)
  • 美团YOLOv6量化部署实战方案
  • 数据库其它调优策略
  • 【Openstack Train安装】四、MariaDB/RabbitMQ 安装
  • 深度学习毕设项目 深度学习 python opencv 动物识别与检测
  • Linux 基本语句_13_消息队列
  • Arduino驱动SHT4x温湿度传感器(温湿度传感器)
  • Python内置函数与标准库函数的详细解读
  • Kubernetes - Pod 拉取镜像报错 ImagePullBackOff
  • 【从浅识到熟知Linux】基本指令之rmdir和rm
  • leetcode 15. 三数之和
  • 如何快速生成项目目录结构树?
  • flink源码分析之功能组件(四)-slotpool组件II
  • 基于minio,上传sql文件后,使用通用查询接口查询并返回
  • 数据结构-02-链表
  • 对二分搜索的理解 Go语言版
  • 从 Elasticsearch 到 SelectDB,观测云实现日志存储与分析的 10 倍性价比提升
  • 智能化质量控制,三坐标尺寸SPC管理系统引领制造新潮流!
  • sqli-labs靶场详解(less32-less37)
  • 什么是主机安全,有什么作用?
  • Android Studio Giraffe-2022.3.1-Patch-3安装注意事项
  • @Value和@ConfigurationProperties的区别,以及@ConfigurationProperties的配置依赖
  • 详解前后端交互时PO,DTO,VO模型类的应用场景
  • [论文阅读]CT3D——逐通道transformer改进3D目标检测
  • RK3568平台开发系列讲解(Linux系统篇)通过OF函数获取设备树节点实验