当前位置：首页 > article >正文

【人工智能】深入理解PyTorch：从0开始完整教程！全文注解

article 2025/2/19 6:00:48

在当今人工智能和深度学习的浪潮中，PyTorch作为一个灵活且强大的深度学习框架，正受到越来越多开发者和研究者的青睐。无论你是初学者还是经验丰富的开发者，这篇文章将带你深入理解PyTorch，从基础概念到高级应用，帮助你在深度学习的道路上更进一步。🌟

为什么选择PyTorch？🤔

在众多深度学习框架中，PyTorch以其动态计算图、简洁的API和强大的社区支持脱颖而出。以下是选择PyTorch的一些理由：

动态计算图：PyTorch的动态计算图使得调试和开发更加直观和灵活。
简洁的API：PyTorch的API设计简洁明了，易于上手。
与Python无缝集成：PyTorch与Python紧密结合，适合快速原型开发。

文章价值展示 🎯

在这篇文章中，你将学到：

PyTorch的基本概念和安装方法
如何使用PyTorch进行数据处理和模型构建
深入理解PyTorch的自动微分机制
使用PyTorch进行模型训练和评估
高级应用：迁移学习和自定义模型

在这里插入图片描述

PyTorch与Python的关系

‌PyTorch是一个基于Python的深度学习库，它充分利用了Python的灵活性和易用性，为开发者提供了简洁而强大的接口。‌ PyTorch的API设计遵循Python的语法规则，使得Python开发者可以快速上手。PyTorch与Python一样，都是动态类型语言，可以在运行时确定变量的类型，并且支持函数式编程范式，可以使用Python的函数和高阶函数进行操作。‌

在库层面，PyTorch的底层数据结构基于NumPy，这使得PyTorch可以与NumPy无缝集成，同时也支持与SciPy、Pandas和Matplotlib等库一起使用，进行科学计算、数据分析和数据可视化。

在应用层面，PyTorch和Python主要用于深度学习领域，例如图像识别和自然语言处理。使用PyTorch和Python，可以开发卷积神经网络（CNN）进行图像识别，以及开发循环神经网络（RNN）和Transformer进行自然语言处理。

体验最新GPT系列模型、支持自定义助手、文件上传：ChatMoss & ChatGPT中文版

PyTorch基础概念

什么是PyTorch？

PyTorch是一个开源的深度学习框架，由Facebook的AI研究团队开发。它提供了灵活的工具来构建和训练神经网络模型，广泛应用于计算机视觉、自然语言处理等领域。

PyTorch的安装

在开始使用PyTorch之前，你需要先安装它。安装PyTorch非常简单，你可以通过以下命令在你的Python环境中安装：

pip install torch torchvision

确保你的Python版本在3.6以上，并且已经安装了pip工具。

PyTorch的基本数据结构：Tensor

Tensor是PyTorch的核心数据结构，类似于NumPy的ndarray，但增加了在GPU上加速计算的能力。以下是创建一个简单Tensor的示例：

import torch

# 创建一个1维Tensor
x = torch.tensor([1.0, 2.0, 3.0])
print(x)

Tensor的基本操作

PyTorch提供了丰富的Tensor操作，包括数学运算、索引、切片等。以下是一些常用的Tensor操作：

# 创建两个Tensor
a = torch.tensor([1.0, 2.0, 3.0])
b = torch.tensor([4.0, 5.0, 6.0])

# 加法
c = a + b
print(c)

# 矩阵乘法
d = torch.matmul(a.view(1, 3), b.view(3, 1))
print(d)

数据处理与模型构建

数据加载与预处理

在深度学习中，数据是模型训练的基础。PyTorch提供了torchvision库，方便我们加载和预处理常见的数据集。

from torchvision import datasets, transforms

# 定义数据预处理步骤
transform = transforms.Compose([
    # 将图像转换为Tensor格式，适合PyTorch处理
    transforms.ToTensor(),
    # 对图像进行归一化处理，均值和标准差均为0.5
    transforms.Normalize((0.5,), (0.5,))
])

# 加载MNIST数据集
train_dataset = datasets.MNIST(root='./data', train=True, transform=transform, download=True)
# 创建数据加载器，批量大小为64，打乱数据顺序
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=64, shuffle=True)

构建神经网络模型

PyTorch提供了torch.nn模块，帮助我们快速构建神经网络模型。以下是一个简单的全连接神经网络示例：

import torch.nn as nn

# 定义一个简单的神经网络类，继承自nn.Module
class SimpleNN(nn.Module):
    def __init__(self):
        # 调用父类构造函数
        super(SimpleNN, self).__init__()
        # 定义第一个全连接层，将输入的784维（28*28）映射到128维
        self.fc1 = nn.Linear(28*28, 128)
        # 定义第二个全连接层，将128维映射到10维（对应10个类别）
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        # 将输入张量展平为一维，-1表示自动计算该维度的大小
        x = x.view(-1, 28*28)
        # 通过第一个全连接层并应用ReLU激活函数
        x = torch.relu(self.fc1(x))
        # 通过第二个全连接层，输出未经过激活的logits
        x = self.fc2(x)
        return x

# 实例化模型
model = SimpleNN()

自动微分与优化

自动微分机制

PyTorch的自动微分机制是其强大的特性之一。通过autograd模块，PyTorch可以自动计算梯度，简化了反向传播的实现。

# 创建一个Tensor并启用梯度计算
x = torch.tensor([2.0, 3.0], requires_grad=True)

# 定义一个简单的函数
y = x[0]**2 + x[1]**3

# 计算梯度
y.backward()

# 查看梯度
print(x.grad)

优化器的使用

PyTorch提供了多种优化器，帮助我们更高效地训练模型。以下是使用SGD优化器的示例：

import torch.optim as optim

# 定义损失函数为交叉熵损失，适用于多分类问题
criterion = nn.CrossEntropyLoss()
# 定义优化器为随机梯度下降（SGD），学习率设置为0.01
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 训练循环，进行10个训练轮次
for epoch in range(10):
    # 遍历训练数据加载器中的每个批次
    for images, labels in train_loader:
        # 前向传播：将输入图像传入模型，获取输出
        outputs = model(images)
        # 计算损失：将模型输出与真实标签进行比较
        loss = criterion(outputs, labels)

        # 反向传播和优化
        # 清空之前的梯度
        optimizer.zero_grad()
        # 计算当前损失的梯度
        loss.backward()
        # 更新模型参数
        optimizer.step()

    # 打印当前轮次的损失值
    print(f'Epoch [{epoch+1}/10], Loss: {loss.item():.4f}')

模型训练与评估

模型训练

在模型训练过程中，我们需要不断调整模型参数，使得损失函数最小化。PyTorch的灵活性使得这一过程变得简单。

# 定义训练函数
def train(model, train_loader, criterion, optimizer, num_epochs):
    # 将模型设置为训练模式，启用dropout等训练时特性
    model.train()
    
    # 遍历指定的训练轮数
    for epoch in range(num_epochs):
        # 遍历训练数据加载器中的每个批次
        for images, labels in train_loader:
            # 将输入图像传入模型，获取输出
            outputs = model(images)
            # 计算损失，criterion是损失函数
            loss = criterion(outputs, labels)

            # 清空之前的梯度
            optimizer.zero_grad()
            # 反向传播，计算当前损失的梯度
            loss.backward()
            # 更新模型参数
            optimizer.step()

        # 打印当前轮次的损失值
        print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

# 调用训练函数，传入模型、训练数据加载器、损失函数、优化器和训练轮数
train(model, train_loader, criterion, optimizer, num_epochs=10)

模型评估

在训练完成后，我们需要评估模型的性能。通常，我们会在验证集或测试集上评估模型的准确性。

# 定义评估函数
def evaluate(model, test_loader):
    # 将模型设置为评估模式，禁用dropout等训练时特性
    model.eval()
    
    # 初始化正确预测的数量和总样本数量
    correct = 0
    total = 0
    
    # 在不计算梯度的上下文中进行评估，以节省内存和计算资源
    with torch.no_grad():
        # 遍历测试数据加载器中的每个批次
        for images, labels in test_loader:
            # 将输入图像传入模型，获取输出
            outputs = model(images)
            # 获取每个样本的预测类别，torch.max返回最大值及其索引
            _, predicted = torch.max(outputs.data, 1)
            # 更新总样本数量
            total += labels.size(0)
            # 更新正确预测的数量
            correct += (predicted == labels).sum().item()

    # 打印模型在测试集上的准确率
    print(f'Accuracy: {100 * correct / total:.2f}%')

# 加载测试数据集，使用MNIST数据集，设置为不训练模式
test_dataset = datasets.MNIST(root='./data', train=False, transform=transform)
# 创建数据加载器，批量大小为64，不打乱顺序
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=64, shuffle=False)

# 调用评估函数，传入模型和测试数据加载器
evaluate(model, test_loader)

高级应用：迁移学习与自定义模型

迁移学习

迁移学习是一种在预训练模型的基础上进行微调的方法，适用于数据量较少的任务。PyTorch提供了丰富的预训练模型，方便我们进行迁移学习。

体验最新GPT系列模型、支持自定义助手、文件上传：ChatMoss & ChatGPT中文版

from torchvision import models
import torch.nn as nn
import torch.optim as optim

# 加载预训练的ResNet模型（ResNet-18）
resnet = models.resnet18(pretrained=True)

# 冻结所有层的参数，使其在训练过程中不更新
for param in resnet.parameters():
    param.requires_grad = False

# 替换最后一层全连接层，以适应新的分类任务
# resnet.fc.in_features获取原全连接层的输入特征数量
resnet.fc = nn.Linear(resnet.fc.in_features, 10)

# 定义优化器，只优化新的全连接层参数
optimizer = optim.SGD(resnet.fc.parameters(), lr=0.01)

自定义模型

在某些情况下，我们可能需要构建自定义模型以满足特定需求。PyTorch的模块化设计使得自定义模型变得简单。

import torch
import torch.nn as nn

# 定义自定义模型类，继承自nn.Module
class CustomModel(nn.Module):
    def __init__(self):
        # 调用父类构造函数
        super(CustomModel, self).__init__()
        # 定义第一个卷积层，输入通道为1（灰度图像），输出通道为32，卷积核大小为3
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3)
        # 定义第二个卷积层，输入通道为32，输出通道为64，卷积核大小为3
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3)
        # 定义第一个全连接层，输入特征为64*12*12，输出特征为128
        self.fc1 = nn.Linear(64*12*12, 128)
        # 定义第二个全连接层，输入特征为128，输出特征为10（对应10个类别）
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        # 前向传播：通过第一个卷积层并应用ReLU激活函数
        x = torch.relu(self.conv1(x))
        # 通过第二个卷积层并应用ReLU激活函数
        x = torch.relu(self.conv2(x))
        # 将特征图展平为一维张量，准备输入全连接层
        x = x.view(-1, 64*12*12)
        # 通过第一个全连接层并应用ReLU激活函数
        x = torch.relu(self.fc1(x))
        # 通过第二个全连接层，输出未经过激活的logits
        x = self.fc2(x)
        return x

# 实例化自定义模型
custom_model = CustomModel()