当前位置: 首页 > article >正文

解决 TypeError: Expected state_dict to be dict-like, got <class ‘*‘>.

这是一个简洁的错误复现和解决文章

文章目录

    • 错误原因
    • 错误重现
    • 正确加载演示
    • 拓展阅读

错误原因

一般是因为混合使用不同的保存和加载方式,问题出在你用 load_state_dict() 去加载别人使用torch.save(model) 保存的整个模型。

错误重现

下面我们来复现它,看是不是和你的操作一致:

  1. 错误地保存整个 model 而不是其 state_dict
    import torch
    import torch.nn as nn
    
    # 定义一个线性模型进行演示
    class LinearModel(nn.Module):
        def __init__(self, input_size, output_size):
            super(LinearModel, self).__init__()
            self.linear = nn.Linear(input_size, output_size)
    
        def forward(self, x):
            return self.linear(x)
    
    # 创建模型实例
    model = LinearModel(input_size=10, output_size=1)
    
    # 打印模型结构
    print("Model:", model)
    
    # 保存模型的 state_dict
    torch.save(model.state_dict(), './linear_model_state_dict.pth')
    
  2. 加载时传入 model 对象:
    # 创建一个新的模型实例
    new_model = LinearModel(input_size=10, output_size=1)
    
    # 加载 state_dict 到新模型
    new_model.load_state_dict(torch.load('./linear_model_state_dict.pth'))
    
    # 打印加载后的新模型结构
    print("Model loaded with state_dict:", new_model)
    
    输出
    Error: Expected state_dict to be dict-like, got <class '__main__.LinearModel'>.
    

正确加载演示

下面是两种保存和加载的方法,任选其一即可。

import torch
import torch.nn as nn

# 定义一个线性模型
class LinearModel(nn.Module):
    def __init__(self, input_size, output_size):
        super(LinearModel, self).__init__()
        self.linear = nn.Linear(input_size, output_size)

    def forward(self, x):
        return self.linear(x)

# 创建模型实例
model = LinearModel(input_size=10, output_size=1)
print("Model:", model)

# 方法 1:保存和加载 state_dict
# 保存模型的 state_dict
torch.save(model.state_dict(), './linear_model_state_dict.pth')

# 创建一个新的模型实例
new_model = LinearModel(input_size=10, output_size=1)

# 加载 state_dict 到新模型
new_model.load_state_dict(torch.load('./linear_model_state_dict.pth'))

# 方法 2:保存和加载整个模型
# 保存整个模型
torch.save(model, './linear_model.pth')

# 加载整个模型
loaded_model = torch.load('./linear_model.pth')

拓展阅读

PyTorch 模型保存与加载的三种常用方式


http://www.kler.cn/a/331559.html

相关文章:

  • 艾体宝案例丨CircleCI 助力 ANA Systems 打造高效 CI/CD 模型
  • WSL Ubuntu
  • 【从零开始入门unity游戏开发之——C#篇08】逻辑运算符、位运算符
  • 04_ok_java_websocket_端口转发_将服务器的流端口转到本地
  • 深度学习之超分辨率算法——SRGAN
  • Webpack简单介绍及安装
  • 在 Ubuntu 下通过 Docker 部署 NAS 服务器
  • 损失函数篇 | YOLOv5 引入Unified-IoU 高质量目标检测IoU损失
  • Vue3项目开发——新闻发布管理系统(九)(完结篇)
  • 项目-坦克大战学习-资源冲突解决
  • 算法 | 鹈鹕算法POA-Transformer-LSTM多变量回归预测
  • redis 5的安装及启动(window)
  • csapp_计算机系统通览
  • 数据校验的总结
  • 《开源大模型食用指南》,一杯奶茶速通大模型!新增Examples最佳实践!
  • 【pytorch】pytorch入门5:最大池化层(Pooling layers )
  • SSY20241002提高组T4题解__纯数论
  • nginx配置多域名共用服务器80端口
  • ICM20948 DMP代码详解(60)
  • SpringBoot技术在墙绘艺术市场的应用
  • 在VS code 中部署C#和avalonia开发环境
  • 【Qt Quick】基础语法:变量类型
  • Vue-Lecture1-Notes
  • Redis Sorted Set 跳表的实现原理与分析
  • Redis:string类型
  • 手部姿态映射到远程操作机器人