当前位置：首页 > article >正文

【Pytorch 入门】DAY 4 损失函数模型的保存与下载

article 2025/3/6 23:28:36

损失函数

通俗理解，如下图所示，为理想与现实的差距

计算实际输出和目标之间的差距
为我们更新输出提供一定的依据（反向传播）grad

官方文档

在这里插入图片描述

L1lOSS

在这里插入图片描述

import torch
from torch.nn import L1Loss

inputs=torch.tensor([1,2,3],dtype=torch.float32)
targets=torch.tensor([1,2,5],dtype=torch.float32)

inputs=torch.reshape(inputs,(1,1,1,3))
tragets=torch.reshape(targets,(1,1,1,3))

loss=L1Loss()
result=loss(inputs,tragets)

print(result)

在这里插入图片描述

MSELoss

均方误差
在这里插入图片描述

loss_mse=MSELoss()
result_mse=loss_mse(inputs,targets)

在这里插入图片描述

CROSSENTROPYLOSS

计算公式
在这里插入图片描述

x=torch.tensor([0.1,0.2,0.3])
y=torch.tensor([1])
x=torch.reshape(x,(1,3))
loss_cross=nn.CrossEntropyLoss()
result_cross=loss_cross(x,y)
print(result_cross)#tensor(1.1019)

交叉熵应用

该网络的输出概率如图所示，batch_size设为1是为了方便查看每一个的输出概率，实际不会设置为1。

dataset=torchvision.datasets.CIFAR10('dataset',train=False,transform=torchvision.transforms.ToTensor(),download=False)
dataloader=DataLoader(dataset,batch_size=1)

class Felix(nn.Module):
    def __init__(self):
        super(Felix,self).__init__()
        self.model1=Sequential(
            Conv2d(3,32,5,padding=2),
            MaxPool2d(2),
            Conv2d(32, 32, 5, padding=2),
            MaxPool2d(2),
            Conv2d(32, 64, 5, padding=2),
            MaxPool2d(2),
            Flatten(),
            Linear(1024, 64),
            Linear(64, 10)
        )

    def forward(self,x):
        x=self.model1(x)
        return x

felix=Felix()
for data in dataloader:
    imgs,targets=data
    outputs=felix(imgs)
    print(outputs)
    print(targets)

在这里插入图片描述
接下来加入交叉熵函数。

loss=nn.CrossEntropyLoss()

felix=Felix()
for data in dataloader:
    imgs,targets=data
    outputs=felix(imgs)
    result_loss=loss(outputs,targets)
    print(result_loss)

结果是实际输出和目标之间的差距
在这里插入图片描述
然后可以实现第二个目的，反向传播，进行参数的更新。

在这里插入图片描述

先断点运行。
网络名称(felix)->model1->Protected Attributes->_models->卷积层（‘0’）->weight->grad
此时梯度为none，还没有开始求值

在这里插入图片描述
接着运行该行代码，可以看到此时梯度被更新

优化器

在官方文档中的位置
在这里插入图片描述
lr:训练速率

步骤

先定义一个优化器
用优化器对网络中的每一个梯度清零
调用损失函数的backward，求出每个节点的grad
optim.step()对模型的每个参数进行调优

loss=nn.CrossEntropyLoss()
felix=Felix()
optim=torch.optim.SGD(felix.parameters(),lr=0.01)#随机梯度下降
for data in dataloader:
    imgs,targets=data
    outputs=felix(imgs)
    result_loss=loss(outputs,targets)
    optim.zero_grad()#梯度设置为0
    result_loss.backward()
    optim.step()

loss=nn.CrossEntropyLoss()
felix=Felix()
optim=torch.optim.SGD(felix.parameters(),lr=0.01)#随机梯度下降
for epoch in range(20):
    running_loss=0.0
    for data in dataloader:
        imgs,targets=data
        outputs=felix(imgs)
        result_loss=loss(outputs,targets)
        optim.zero_grad()#梯度设置为0
        result_loss.backward()
        optim.step()
        running_loss=running_loss+result_loss#每轮开始前将loss设置为0，在学习过程中所有的loss总和
    print(running_loss)

运行结果
在这里插入图片描述

现有网络模型的使用及修改

Imagnet

root:下载路径
split:
transform:是否在数据集上进行变换
target_transform：在target上进行变换

准备

查看是否有 scipy这个包

没有，安装
下载数据集
但是发现并不能下载，该数据集很大，不适合用于学习

模型的保存与加载

1. 不仅保存了网络模型的结构，也保存了网络模型的参数

保存模型

vgg16=torchvision.models.vgg16(pretrained=False)#使用网络模型的参数没有经过训练
#保存方式1
torch.save(vgg16,'vgg16_method1.pth')

在这里插入图片描述

加载模型

import torch
# 方式1-》保存方式1，加载模型
model=torch.load('vgg16_method1.pth')
print(model)

在这里插入图片描述

2. VGG模型中的参数保存成字典，不保存结构（官方推荐，与第一种比需要的空间小）

保存模型

#保存方式2
torch.save(vgg16.state_dict(),'vgg16_method2.pth')

在这里插入图片描述

加载模型

可以看出来是字典的形式

#方式2
model=torch.load('vgg16_method2.pth')
print(model)

在这里插入图片描述
可以加载模型的结构

vgg16=torchvision.models.vgg16(pretrained=False)
vgg16.load_state_dict(torch.load('vgg16_method2.pth'))
print(vgg16)

备注

from model_save import *#其中model_save为要保存的模型

查看全文

http://www.kler.cn/a/154531.html

第十一节HarmonyOS 常用容器组件1-Row与Column

Linux的基本指令（五）

【ArcGIS Pro微课1000例】0039：制作全球任意经纬网的两种方式

为自己创建的游戏编程源码申请软件著作权详细流程（免费分享模板）

springboot数据格式验证——自定义日期格式验证及list验证

大数据湖项目建设方案：文档全文101页，附下载

判断是否有环形链表

消息对列MQ

【渗透】记录阿里云CentOS一次ddos攻击

【Java 基础】16 泛型

充电桩自检流程

公司网站遇到HTTPS攻击，有什么办法解决

百度下拉词挖掘工具，百度下拉词挖掘获取软件

python程序内存泄漏的解决方法

分享几个可以免费使用GPT工具

毕业论文管理系统的设计与实现

Docker 简介及其常用命令详解

Android 13 - Media框架（18）- CodecBase

记录 | ssh config免密连接

Mybatis 的操作(要结合上个博客一起)续集

损失函数

L1lOSS

MSELoss

CROSSENTROPYLOSS

交叉熵应用

优化器

步骤

现有网络模型的使用及修改

Imagnet

准备

模型的保存与加载

1. 不仅保存了网络模型的结构，也保存了网络模型的参数

保存模型

加载模型

2. VGG模型中的参数保存成字典，不保存结构（官方推荐，与第一种比需要的空间小）

保存模型

加载模型

备注

相关文章：