2024/12/8周报
文章目录
- 摘要
- Abstarct
- 文献
- 题目
- 引言
- 研究背景
- 方法论
- 数据与标准化
- 变分模态分解(VMD)
- 双向长短期记忆网络(BiLSTM)
- 模型训练与评估
- 实验结果与讨论
- 总结
摘要
本周继续完善年度报告中的相关内容,该年度中大数据模块是重点,联盟链和人工智能部分是2025年度的重点。接着阅读了一篇预测PM2.5空气质量预测的文章,作者提出了一种结合变分模态分解(VMD)和双向长短期记忆网络(BiLSTM)的混合深度学习模型——VMD-BiLSTM,以预测中国城市的PM2.5变化。该模型显著提高了预测准确性,并且在与现有模型如基于EMD的模型和其他VMD基模型的对比中表现出色。此外,还进行了污水处理厂污水水质预测的相关实验,实验结果还不错。
Abstarct
This week, we continued to refine the relevant content in the annual report, in which the big data module is the focus, and the consortium blockchain and artificial intelligence part are the focus in 2025. Next, reading an article that predicts PM2.5 air quality predictions, the authors proposed a hybrid deep learning model, VMD-BiLSTM, that combines variational mode decomposition (VMD) and bidirectional long short-term memory networks (BiLSTM) to predict PM2.5 changes in Chinese cities. The model significantly improves prediction accuracy and performs well compared to existing models such as EMD-based models and other VMD-based models. In addition, experiments related to the prediction of sewage water quality in sewage treatment plants were also carried out, and the experimental results were good.
文献
题目
A hybrid deep learning technology for PM2.5 air quality forecasting
引言
随着全球城市化进程的加速,世界范围内空气质量普遍下降。空气污染事件或异常天气在许多国家显著增加,严重威胁当地居民的生活和社会发展。因此,近年来,加强空气质量监测和空气污染预报成为人工智能(AI)技术快速发展中的热门话题。PM2.5是指空气中直径小于或等于2.5微米的细颗粒物,相较于其他较粗的大气颗粒,它们更小且传输距离更远,对人类健康影响更大。
PM2.5预测方法主要分为数值建模和统计建模两种。前者基于物理化学特性进行数值计算,后者则利用机器学习(ML)和深度学习(DL)技术。本文提出了先进的双向长短期记忆神经网络(BiLSTM)来预测PM2.5的时间序列数据,并采用变分模态分解(VMD)将PM2.5非周期信号在频率域中分解,从而降低输入信号频率域复杂度并提高预测精度。
研究背景
时间序列预测是AI中的一个热门话题,特别是在时间序列动态且非线性的情况下。对于非线性时间序列数据预测问题,基于AI的方法通常比传统方法表现更好。LSTM因其独特的门控结构而广泛应用于各种时间序列预测领域。近年来,LSTM及其扩展形式被广泛应用于家庭用电预测、光伏发电预测等领域,显示了出色的性能。此外,LSTM还被应用于股票价格预测、文本识别等多个领域。
在空气质量预测方面,LSTM及其扩展形式也得到了广泛应用。例如,有研究者提出了结合卷积神经网络(CNN)和LSTM的混合深度学习模型,用于预测未来24小时内的PM2.5浓度;还有研究者结合卡方检验(CT)与LSTM进行空气质量预测,其准确性高于传统的机器学习方法。此外,一些研究者通过引入注意机制(Attention Mechanism)增强了LSTM单元的功能,提高了预测精度。
方法论
数据与标准化
本文使用的数据集来源于UCI机器学习知识库,具体为2013年至2017年间北京及其周边12个观测站记录的空气质量数据。这些数据由美国大使馆提供,原始数据集以每小时间隔采样和记录,总共包含35,064个样本(1461天)。为了验证模型的有效性,我们在实验中选择了昌平观测站的数据作为研究对象,并将前24,000个数据点(1000天)作为训练集,最后2400个数据点(100天)作为测试集。
数据标准化是时间序列预测中的关键步骤之一。我们采用了零均值标准化方法对数据进行了处理,即通过公式 ,将数据转换为服从标准正态分布的形式,其中 μ 是均值,σ 是标准差。这种标准化方法确保了数据的稳定性和一致性,有助于提高后续模型训练的效果。
变分模态分解(VMD)
由于原始PM2.5数据在频率域内剧烈波动且分布复杂,直接对其进行高精度预测非常困难。因此,本文引入了变分模态分解(VMD)方法,以降低输入信号的非线性和不稳定性。VMD是一种自适应信号分解技术,可以将复杂的非周期信号分解为多个固有模态函数(IMFs),每个IMF具有有限带宽和中心频率。
VMD的核心思想是构建一个变分问题,该问题旨在最小化各模式估计带宽之和,同时保证所有模式成分的总和等于原始信号。具体来说,给定原始信号 f(t),VMD将其分解为K个模式变量 u_k (t),每个模式具有有限带宽和中心频率 ω_k。变分问题的目标函数定义为:
约束条件为:
为了求解上述约束变分问题,我们引入了惩罚因子 α 和拉格朗日乘子 λ(t),将问题转化为无约束变分问题。然后,使用交替方向乘子法(ADMM)迭代算法优化得到的模式成分和中心频率,最终求得增广拉格朗日方程的最优解。详细的迭代过程如下:
其中,γ 是噪声容限, 是新生成的傅里叶变换值。图1展示了VMD分解后的原始PM2.5时间序列数据波形,从低频到高频依次排列。
双向长短期记忆网络(BiLSTM)
传统递归神经网络(RNN)模型和长短期记忆递归神经网络(LSTM)模型中,信息只能向前传播,这使得当前状态信息输出仅依赖于当前时刻。然而,对于空气质量管理而言,PM2.5浓度数据随时间波动较大,前后状态之间存在强相关性。因此,本文选择双向长短期记忆神经网络(BiLSTM)来预测PM2.5数据,以获取前后时间段的信息分布特征,从而接收更全面的特征信息并提高预测准确性。
BiLSTM模型由两个LSTM单元组成:一个负责处理从前向后的信息流,另一个则处理从后向前的信息流。每个LSTM单元内部结构如图2所示,包括遗忘门、输入门和输出门三个主要组件。遗忘门用于忽略历史信息的选择性处理;输入门和输出门分别用于当前单元的信息输入和输出。具体计算公式如下:
其中,σ 表示Sigmoid激活函数,⊙ 表示元素级乘法。图3展示了BiLSTM单元的内部结构,可以看到它由一个前向LSTM和一个后向LSTM组成,能够同时捕捉到当前时间点的前后特征信息。
模型训练与评估
为了训练和评估所提出的VMD-BiLSTM模型,我们设计了一系列实验流程,如图4所示。整个实验分为三个阶段:数据预处理、分解预测和结果分析。首先,对原始数据进行标准化和分割;其次,将单变量PM2.5数据分解为K个IMFs,并应用BiLSTM模型学习和预测分解后的数据组件;最后,将所有BiLSTM的输出连接起来并与实际PM2.5数据进行比较。
在实际实现中,每个BiLSTM的超参数设置如下:epoch=16, dropout=0.1, output_dim=64, activation=‘linear’, validation_split=0.05, learning rate=0.001(静态),decay=0。所有超参数在实验过程中经过调优以获得最佳性能。损失函数采用均方误差(MSE),优化器选择了根均方传播(RMSProp),以最大限度地避免梯度下降过程中的震荡效应,从而加速收敛过程。
为了确定VMD分解的最佳模式数量K,我们通过五种评价指标(MAE、RMSE、MAPE、R²、ACC)和训练时间来评估不同K值下的预测性能。根据表1的结果,随着K值的增加,预测性能持续改善但逐渐饱和。此外,随着K值的增加,计算成本和时间消耗也随之上升。综合考虑预测效果和计算成本,最终选择K=8作为实验中的分解数。
实验结果与讨论
通过对不同模型的对比实验,我们验证了VMD-BiLSTM模型的有效性。图8展示了VMD-BiLSTM与其他传统机器学习算法(如决策树、随机森林、支持向量机回归(SVR)、多层感知器(MLP))的预测性能比较。结果显示,传统机器学习方法在频繁波动的数据区间内预测偏差较大,而VMD-BiLSTM模型的预测曲线更贴近真实值,预测结果优于传统机器学习模型。
图9展示了VMD-BiLSTM与其他LSTM扩展模型(如常规LSTM、嵌套LSTM(NLSTM)、双向LSTM)的预测性能比较。结果显示,没有信号分解的LSTM模型预测曲线上存在明显的滞后现象,导致预测结果不够理想,平均绝对百分比误差(MAPE)值约为30%,趋势预测准确率低于50%。相比之下,结合VMD分解的BiLSTM模型表现出色,预测结果更为准确。
图10和图11分别展示了VMD-BiLSTM与其他结合经验模态分解(EMD)或VMD的混合模型(如EMD-LSTM、EMD-NLSTM、EMD-BiLSTM、VMD-LSTM、VMD-NLSTM)的预测性能比较。结果显示,虽然EMD分解在预测峰值时表现良好,但在峰值起始和结束处存在严重延迟和波动,影响了整体预测效果。而VMD-BiLSTM模型不仅避免了信号延迟现象,而且在各项评价指标上均优于其他模型。
为了进一步验证VMD-BiLSTM模型的预测效果,我们绘制了散点图(图12)和相对预测误差极坐标图(图14),直观地展示了预测结果。散点图显示,传统机器学习方法的预测结果偏差较大,而结合VMD分解的时间序列模型预测结果更为接近真实值。相对预测误差极坐标图表明,VMD-BiLSTM模型的预测误差曲线最靠近原点,说明其预测效果最佳。
总结
综上所述,本文提出的VMD-BiLSTM模型在PM2.5空气质量预测方面表现出色,具有较高的预测精度和稳定性。未来的研究将进一步扩展该模型的应用领域,并探索多通道模型以提升预测效果。