当前位置: 首页 > article >正文

使用 LSTM(长短期记忆网络) 模型对时间序列数据(航空旅客人数数据集)进行预测

代码功能

  1. 数据准备
    加载数据:从公开的航空旅客人数数据集(Airline Passengers Dataset)中读取时间序列数据。
    对数变换和平稳化:对数据应用 log1p 函数减少趋势和波动,使模型更容易学习规律。
    归一化处理:将数据缩放到 [0, 1] 区间,以适应神经网络训练。
  2. 数据集创建
    滑动窗口机制:使用过去 seq_length(12个月)作为输入,预测下一个月的值。
    划分数据集:将时间序列数据划分为训练集(80%)和测试集(20%)。
  3. 模型定义
    LSTM 模型:
    输入特征维度:每个月的数据点作为输入特征(维度为 1)。
    隐藏层维度:每层隐藏层包含 128 个神经元。
    层数:10 层 LSTM 堆叠,增加模型的表达能力。
    全连接层(FC Layer):LSTM 的输出通过全连接层,生成最终预测值。
  4. 模型训练
    损失函数:使用均方误差(MSE),衡量预测值与真实值之间的误差。
    优化器:使用 Adam 优化器,动态调整学习率提高收敛速度。
    GPU 加速:如果设备支持,则将模型和数据移至 GPU,显著加速训练。
    训练过程中,模型使用批量数据更新权重,逐步最小化损失函数。
  5. 模型评估
    预测值生成:在测试集上进行预测。
    反归一化和还原对数变换:将预测值和真实值转换回原始规模,便于直观对比。
    性能评估:计算均方误差(MSE),衡量模型的预测准确性。
  6. 可视化结果
    实际值 vs. 预测值:绘制原始数据的真实值与预测值对比图,直观展现模型效果。
    在这里插入图片描述

代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import torch
from torch import nn
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error
from torch.utils.data import DataLoader, TensorDataset

# 1. 加载数据
url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv"
data = pd.read_csv(url, parse_dates=['Month'], index_col='Month')
data_values = data['Passengers'].values.astype(float).reshape(-1, 1)

# 对数变换使数据平稳化
data_log = np.log1p(data_values)

# 归一化数据
scaler = MinMaxScaler(feature_range=(0, 1))
normalized_data = scaler.fit_transform(data_log)

# 2. 创建数据集函数
def create_dataset(data, seq_length):
    X, y = [], []
    for i in range(len(data) - seq_length):
        X.append(data[i:i + seq_length])
        y.append(data[i + seq_length])
    return np.array(X), np.array(y)

seq_length = 12  # 使用过去12个月预测下一个月
X, y = create_dataset(normalized_data, seq_length)

# 划分训练集和测试集
train_size = int(len(X) * 0.8)
X_train, X_test = X[:train_size], X[train_size:]
y_train, y_test = y[:train_size], y[train_size:]

# 转换为 PyTorch 张量
X_train = torch.tensor(X_train, dtype=torch.float32)
y_train = torch.tensor(y_train, dtype=torch.float32)
X_test = torch.tensor(X_test, dtype=torch.float32)
y_test = torch.tensor(y_test, dtype=torch.float32)

# 创建 DataLoader
train_dataset = TensorDataset(X_train, y_train)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)

# 3. 定义 LSTM 模型
class LSTMModel(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim, num_layers):
        super(LSTMModel, self).__init__()
        self.hidden_dim = hidden_dim
        self.lstm = nn.LSTM(input_dim, hidden_dim, num_layers, batch_first=True, dropout=0.2)
        self.fc = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        h0 = torch.zeros(num_layers, x.size(0), self.hidden_dim).to(x.device)
        c0 = torch.zeros(num_layers, x.size(0), self.hidden_dim).to(x.device)
        out, _ = self.lstm(x, (h0, c0))
        out = self.fc(out[:, -1, :])
        return out

# 超参数设置
input_dim = 1
hidden_dim = 128
output_dim = 1
num_layers = 10  # 增加到10层 LSTM
learning_rate = 0.0001
num_epochs = 300

# 初始化模型、损失函数和优化器
model = LSTMModel(input_dim, hidden_dim, output_dim, num_layers)
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# 检查 GPU
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)

# 4. 模型训练
for epoch in range(num_epochs):
    model.train()
    for X_batch, y_batch in train_loader:
        X_batch, y_batch = X_batch.to(device), y_batch.to(device)
        outputs = model(X_batch)
        optimizer.zero_grad()
        loss = criterion(outputs, y_batch)
        loss.backward()
        optimizer.step()

    if (epoch + 1) % 10 == 0:
        print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}")

# 5. 模型评估
model.eval()
with torch.no_grad():
    y_pred = model(X_test.to(device)).cpu().numpy()

# 反归一化预测结果
y_test_inv = scaler.inverse_transform(y_test.numpy())
y_pred_inv = scaler.inverse_transform(y_pred)

# 计算均方误差 (MSE)
mse = mean_squared_error(np.expm1(y_test_inv), np.expm1(y_pred_inv))  # 还原对数变换
print(f"Mean Squared Error: {mse:.4f}")

# 6. 可视化预测结果
plt.figure(figsize=(12, 6))
plt.plot(data.index[-len(y_test):], np.expm1(y_test_inv), label='Actual')
plt.plot(data.index[-len(y_test):], np.expm1(y_pred_inv), label='Predicted', color='orange')
plt.title('Airline Passenger Data Prediction')
plt.xlabel('Date')
plt.ylabel('Passengers')
plt.legend()
plt.show()


http://www.kler.cn/a/403888.html

相关文章:

  • Docker3:docker基础1
  • 【Maven】IDEA创建Maven项目 Maven配置
  • 【前端】JavaScript中的indexOf()方法详解:基础概念与背后的应用思路
  • Arcgis 地图制作
  • 【WPF】Prism学习(六)
  • 关联度分析、灰色预测GM(1,1)、GM(1,1)残差模型——基于Python实现
  • vue2.0新建项目
  • 无人机侦察打击方案(3)
  • 亚马逊云服务器(AWS):功能、优势与使用指南
  • 【YOLOv8】安卓端部署-1-项目介绍
  • 【C++】数据上传的方式。持久化的方式。通过 JSON,序列化与反序列化。
  • Vue2 Class Component 使用指南:提升组件开发的可维护性
  • 嵌入式linux中QT信号与槽基本操作与实现
  • CSS一些练习过程
  • 深度学习:ResNet每一层的输出形状
  • vue3项目执行npm install下载依赖报错问题排查方法
  • [WPF] RichTextBox如何显示省略号?
  • 学习ASP.NET Core的身份认证(基于Cookie的身份认证1)
  • Comfy UI 工作流(三)高清修复 - 低显存放大
  • 实验室管理效率提升:Spring Boot技术的力量
  • MySQL高可用方案之PXC(Percona XtraDB Cluster)
  • 13 go语言(golang) - 函数
  • Excel常用技巧分享
  • Android 网络请求(二)OKHttp网络通信
  • 公安、监管等政务部门实现数字化转型的解决方案
  • 【WPF】Prism学习(三)