回归预测模型 | LSTM、CNN、Transformer、TCN、串行、并行模型集合
往期精彩内容:
时序预测:LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较
全是干货 | 数据集、学习资料、建模资源分享!
EMD变体分解效果最好算法——CEEMDAN(五)-CSDN博客
拒绝信息泄露!VMD滚动分解 + Informer-BiLSTM并行预测模型-CSDN博客
单步预测-风速预测模型代码全家桶-CSDN博客
CEEMDAN +组合预测模型(BiLSTM-Attention + ARIMA)-CSDN博客
CEEMDAN +组合预测模型(Transformer - BiLSTM + ARIMA)-CSDN博客
基于麻雀优化算法SSA的CEEMDAN-BiLSTM-Attention的预测模型-CSDN博客
基于麻雀优化算法SSA的CEEMDAN-Transformer-BiGRU预测模型-CSDN博客
半天入门!锂电池剩余寿命预测(Python)-CSDN博客
超强预测模型:二次分解-组合预测-CSDN博客
VMD + CEEMDAN 二次分解,BiLSTM-Attention预测模型-CSDN博客
超强预测算法:XGBoost预测模型-CSDN博客
基于麻雀优化算法SSA的预测模型——代码全家桶-CSDN博客
VMD + CEEMDAN 二次分解,CNN-Transformer预测模型-CSDN博客
独家原创 | SCI 1区 高创新预测模型!-CSDN博客
风速预测(八)VMD-CNN-Transformer预测模型-CSDN博客
高创新 | CEEMDAN + SSA-TCN-BiLSTM-Attention预测模型-CSDN博客
VMD + CEEMDAN 二次分解,Transformer-BiGRU预测模型-CSDN博客
独家原创 | 超强组合预测模型!-CSDN博客
全网最低价 | 全家桶持续更新!-CSDN博客
独家原创 | 基于TCN-SENet +BiGRU-GlobalAttention并行预测模型-CSDN博客
VMD + CEEMDAN 二次分解——创新预测模型合集-CSDN博客
独家原创 | BiTCN-BiGRU-CrossAttention融合时空特征的高创新预测模型-CSDN博客
CEEMDAN +组合预测模型(CNN-Transfromer + XGBoost)-CSDN博客
时空特征融合的BiTCN-Transformer并行预测模型-CSDN博客
独家首发 | 基于多级注意力机制的并行预测模型-CSDN博客
独家原创 | CEEMDAN-CNN-GRU-GlobalAttention + XGBoost组合预测-CSDN博客
多步预测系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合-CSDN博客
独家原创 | CEEMDAN-Transformer-BiLSTM并行 + XGBoost组合预测-CSDN博客
● 环境框架:python 3.9 pytorch 1.8 及其以上版本均可运行
● 使用对象:论文需求、毕业设计需求者
● 代码保证:代码注释详细、即拿即可跑通。
什么是回归预测?和一般的时间序列预测有什么不同?
1. 回归预测:
-
回归预测通常指的是利用特征来预测一个连续型的目标变量。例如,根据房屋的面积、地理位置、房龄等特征来预测房价。在回归预测中,目标变量一般是连续的实数值,可以是任意范围内的数值。
-
回归预测的特征可以包括各种类型的数据,包括数值型、类别型、文本型等,而目标变量是连续的实数值。
-
常见的回归模型包括线性回归、岭回归、Lasso回归、决策树回归、随机森林回归等。
2. 时间序列预测:
-
时间序列预测是指根据一系列按时间顺序排列的数据点,预测未来的数值。这些数据点通常是按照固定时间间隔采集的,比如每天、每月或每年。
-
时间序列预测的目标是根据过去的数据来预测未来的数值,因此时间顺序在预测任务中非常重要。
-
时间序列预测通常涉及到一些特定的方法,比如ARIMA模型、LSTM(Long Short-Term Memory)神经网络、Prophet模型等,这些方法能够充分利用数据中的时间结构和周期性。
包括完整流程数据代码处理:
回归预测数据集制作、数据加载、模型定义、参数设置、模型训练、模型测试、预测可视化、模型评估
配有代码、文件介绍:
前言
本文基于 Kaggle平台——洪水数据集的回归预测(文末附数据集),介绍一种基于CNN-LSTM网络的回归预测模型。
以下是数据集中各列的描述(包括功能名称的含义):
MonsoonIntensity(季风强度):这一特征可能衡量该地区季风降雨的强度和频率,较高的值表示降雨强度更大,可能更频繁,这可能会导致更高的洪水风险。
TopographyDrainage(地形排水):反映地形的自然排水能力。更好的排水能力(可能由更高的分数表示)可能表明,由于人口稠密或关键地区的水流更好,洪水风险更低。
RiverManagement(河流管理):评估河流在防洪方面的管理情况,包括河岸、大坝和其他基础设施的维护。更高的分数可能意味着更好的管理,有可能降低洪水风险。
Deforestation(森林砍伐):衡量影响土壤稳定性和吸水性的森林砍伐率或程度。更高的森林砍伐分数可能表明森林覆盖的损失更大,更容易受到洪水的影响。
Urbanization(城市化):表示城市发展水平,由于不透水表面的增加,通常会降低土地吸收降雨的自然能力。城市化程度的提高可能与洪水风险的增加有关。
ClimateChange(气候变化): 评估气候变化的影响,如降雨量增加或海平面上升,这可能会加剧洪水。得分越高可能表示更容易受到这些变化的影响。
DamsQuality(水坝质量): 研究大坝在防洪中的状况和有效性。大坝质量差或维护不善可能导致更高的洪水风险。
Siltation(淤积): 测量水体中淤泥堆积的程度,这会降低其管理水流的能力,增加洪水风险。
AgriculturalPractices (农业实践): 评估农业活动对洪水风险的影响,考虑灌溉方法和土地使用等可能影响径流和土壤侵蚀的因素。
Encroachments(侵扰): 对人类入侵洪水易发地区的程度进行评分,这可能会加剧洪水的严重性。
IneffectiveDisasterPreparedness(无效的灾难准备): 反映了备灾计划及其实施的不足。得分越高可能表明准备工作越差,潜在的破坏和洪水恢复时间越长。
DrainageSystems(排水系统): 评估城市和农村地区排水系统处理强降雨和水流的效率和容量。
CoastalVulnerability(海岸脆弱性): 评估沿海地区因风暴潮、海平面上升和气旋活动等因素而发生洪水的风险。
Landslides(滑坡): 表示山体滑坡的风险和历史,当这些天然大坝决堤时,山体滑坡会堵塞河流,并在下游造成突发洪水。
Watersheds(流域): 评估流域的健康和管理,流域在管理水资源和减轻洪水风险方面发挥着关键作用。
DeterioratingInfrastructure(不断恶化的基础设施): 查看与洪水管理相关的基础设施的总体状况,如下水道、桥梁和道路。恶化会阻碍有效的洪水应对。
PopulationScore(人口得分): 测量洪水易发地区的人口密度或增长,这可能会影响洪水对人类社区的影响。
WetlandLoss(湿地流失): 量化湿地的减少,湿地通过吸收洪水起到天然缓冲作用。
InadequatePlanning(计划不足): 评估区域和城市规划在多大程度上整合了洪水风险管理,包括分区和土地利用政策。
PoliticalFactors(政治因素): 考虑政治决策、治理和政策实施如何影响洪水管理实践。
FloodProbability(洪水概率): 该结果变量基于上述因素预测洪水的可能性,可能表示为0到1之间的概率。
1 数据预处理
2 基于CNN-LSTM的回归预测模型
2.1 定义CNN-LSTM网络模型
2.2 设置参数,训练模型
50个epoch,MSE 极小,CNN-LSTM回归预测模型预测效果显著,模型能够充分提取数据特征,收敛速度快,性能优越,预测精度高,适当调整模型参数,还可以进一步提高模型预测表现。
注意调整参数:
-
可以适当增加CNN层数和每层通道数,微调学习率;
-
调整LSTM层数和每层神经元个数,增加更多的 epoch (注意防止过拟合)
-
可以改变滑动窗口长度(设置合适的窗口长度)