当前位置: 首页 > article >正文

Pytorch基本知识

model.state_dict()、model.parameters()和model.named_parameters()的区别

parameters()只包含模块的参数,即weight和bias(包括BN的)。
named_parameters()返回包含模块名和模块的参数的列表,列表的每个元素均是包含layer name和layer param的元组。layer param就是parameters()的内容。
state_dict()返回包含模块整个状态的字典,除model.parameters()外,还包括model.buffer()如running_mean、running_var等BN相关参数。保存参数时需保存state_dict()。
值得注意的是,model.state_dict()所存储的模型参数tensor的require_grad都是False,而model.named_parameters()模型参数中的require_grad属性都是True。

加载模型

model=ResNet()

model.load_state_dict(torch.load('ckpt.pth')) 

Pytorch内存管理

查看tensor内存状态:tensor.storage()
查看tensor间是否共享内存:id(tensor1.storage()) == id(tensor2.storage())
查看tensor元首素相对于storage地址的偏移量:tensor.storage_offset()
查看tenso


http://www.kler.cn/a/329463.html

相关文章:

  • HTML<center>标签
  • Python 正则表达式
  • 【多线程】线程池
  • 计算机网络 (51)鉴别
  • 电力场景红外测温图像绝缘套管分割数据集labelme格式2436张1类别
  • 周末总结(2024/01/18)
  • 04.useTitle
  • 第L6周:机器学习|支持向量机(SVM):2. 支持向量机实战
  • 深入探索机器学习中的聚类算法
  • 每日一题|983. 最低票价|动态规划、记忆化递归
  • OpenCV视频I/O(4)视频采集类VideoCapture之获取异常处理模式函数getExceptionMode()的使用
  • 【JavaEE初阶】深入理解多线程阻塞队列的原理,如何实现生产者-消费者模型,以及服务器崩掉原因!!!
  • 2024年7月大众点评全国美食店铺基础信息分析
  • C++初阶:STL详解(十)——priority_queue的介绍,使用以及模拟实现
  • 【C++】第一节:C++入门
  • Spring Boot与足球青训后台系统的协同
  • Golang | Leetcode Golang题解之第442题数组中重复的数据
  • Python知识点:使用Azure IoT Edge与Python进行边缘计算
  • SpringBoot-MybatisPlus项目中,在控制台查看sql执行日志的方法
  • Git 与标签管理
  • 人工智能领域机器学习与深度学习的区别
  • 初始爬虫10
  • Django学习笔记三:QuerySet使用详解
  • Rust赋能前端:为WebAssembly 瘦身
  • 8.使用 VSCode 过程中的英语积累 - Help 菜单(每一次重点积累 5 个单词)
  • 第1 章 第一节:基础语法