多元时间序列预测的范式革命:从数据异质性到基准重构
本推文介绍了一篇来自中国科学院计算技术研究所等机构的论文《Exploring Progress in Multivariate Time Series Forecasting: Comprehensive Benchmarking and Heterogeneity Analysis》,发表在《IEEE Transactions on Intelligent Transportation Systems》。论文针对多变量时间序列(MTS)预测中实验结果不一致、技术方向选择困难等问题,提出了首个专门为MTS预测设计的基准框架BasicTS+,通过统一训练流程和评估标准,实现了45种模型在20个数据集上的公平对比。
研究首次揭示了MTS数据集的异质性特征,根据时间序列的稳定性和空间依赖程度将数据集分为三大类,并发现模型性能与数据特征密切相关:例如Transformer模型在具有稳定周期模式的数据集上表现优异,而简单线性模型在分布漂移或无明确模式的数据中更具优势。实验结果表明,现有模型的有效性高度依赖数据类型,盲目套用结论可能导致误判。该研究不仅为MTS预测提供了可靠的评估工具,还为模型选择和数据集设计提供了理论依据,为复杂系统如交通、能源领域的时间序列分析奠定了方法论基础。
论文链接:https://ieeexplore.ieee.org/abstract/document/10726722
代码与数据集:https://github.com/GestaltCogTeam/BasicTS
一、 领域困境:实验结果为何"打架"?
在交通、能源等复杂系统的智能决策中,多元时间序列(MTS)预测扮演着核心角色。然而,当前研究存在两大痛点:
(1)结论矛盾:同一模型在不同研究中表现差异显著(如DCRNN在PEMS04的MAE波动达33%)
(2)方法困惑:Transformer与线性模型的优劣之争持续数年,STGNN的必要性饱受质疑
中国科学院计算技术研究所团队在《IEEE Transactions on Knowledge and Data Engineering》发表的最新研究,首次系统性揭示了这些矛盾背后的根本原因——数据异质性,并构建了首个公平可比的基准框架BasicTS+。
二、 核心突破:BasicTS+基准框架
2.1 BasicTS+框架及基本流程
图1展示了BasicTS+的框架,其中主要包括BasicTS+的核心组件和用户配置文件两部分。
图1 BasicTS+的框架
BasicTS+框架的基本流程如下:
(1)数据预处理:强制Z-score归一化,自动添加时间戳、星期几等10+外部特征
(2)训练策略:采用掩码MAE损失函数,整合课程学习与梯度裁剪技术
(3)评估标准:提供MAE/RMSE/MAPE/WAPE等8维度指标,支持归一化与反归一化双重验证
通过标准化数据加载、训练运行与评估流程,BasicTS+实现了45种模型在20个数据集上的公平对比。实验显示,统一标准使模型性能平均提升25%,消除了因实验设置差异导致的误判。
2.2 数据异质性分类体系
研究首次提出MTS数据的双维度分类标准:
(1)图2展示了以时间特征维度MTS数据的分类标准,为稳定周期模式、分布漂移模式和无明确模式,分别对应PEMS03/04/08、ETTh2/ETTm2和ExchangeRate典型数据集。
图2 多个MTS数据集中的不同时间模式
(2)图3展示了以空间特征维度MTS数据的分类标准,为高不可区分性、低不可区分性,分别对应METR-LA/BAY、ETTm1/ETTm2典型数据集。
图3 不同数据集中的空间不可区分性
三、颠覆性发现:数据决定模型命运
3.1 时间维度的"模型适配法则"
(1)稳定周期数据:表1中可以看出,Transformer架构(如FEDformer)通过捕捉多尺度周期性,在PEMS04的MAE达26.89,较线性模型低39.49%
(2)分布漂移数据:表1中可以看出,线性模型(DLinear)因抗过拟合能力,在ETTh2的MAE仅3.13,优于Transformer的3.27
(3)无明确模式数据:所有模型性能相近,凸显预测本质困难
表1 高级模型和基线模型在异构MTS数据集中的性能
3.2 空间维度的"建模边界"
(1)高不可区分性数据:表2中可以看出,STID通过空间身份嵌入,在METR-LA的MAE达3.12,较移除空间模块的STID*降低12.85%
(2)低不可区分性数据:表2中可以看出,保留GCN的AGCRN在ETTm1的MAE反而比AGCRN*高21.16%
表2 STID、AGCRN及其变体在具有不同空间不可区分性的数据集上的性能
表2呈现了STID、AGCRN及其变体在不同空间不可区分性数据集上的性能差异:在空间不可区分性高的LA、BAY数据集中,含空间依赖模块的STID、AGCRN表现更优;而在空间不可区分性低的ER、ETTm1数据集中,去掉空间模块的变体(STID*、AGCRN*)性能更突出,如ER数据集MAPE指标中,变体较原模型下降25.31%。Gap数据进一步表明,空间依赖模块在低空间不可区分性数据集中会导致性能损失,验证了研究中“模型空间建模需适配数据空间异质性”的结论——高空间不可区分性数据适合依赖空间模块的模型,低空间不可区分性数据无需复杂空间建模,凸显模型与数据空间特征适配的关键作用。
四、实践指南:模型选择路线图
图4 多元时间序列(MTS)模型选择路线图
(1)时间维度判断:首先分析数据是否具有稳定周期性。若有,直接选用Transformer/STGNN模型;
(2)进一步细分:如果数据无稳定周期,接着判断是否属于分布漂移型。若是,适配线性模型+动态调整方案;
(3)最终判定:如果数据既无稳定周期,也非分布漂移(即无明确模式),则采用简单模型+不确定性估计的组合。
整个流程环环相扣,基于数据时间特征层层筛选,确保模型与数据特性精准匹配。
五、未来展望:从"模型竞赛"到"数据理解"
该研究带来三大启示:
(1)数据特征优先:复杂模型的有效性高度依赖数据模式,盲目追求架构创新可能适得其反
(2)基准重构意义:BasicTS+为领域提供了可复现的评估标准,推动研究从"黑箱竞赛"转向科学验证
(3)应用转化路径:在智慧交通、能源调度等场景,应先进行数据特征诊断,再匹配模型架构
这项研究不仅为多元时间序列预测建立了新的方法论框架,更深刻揭示了AI模型与数据本质的相互作用规律。当我们在赞叹Transformer的强大时,或许更应关注数据背后跳动的"脉搏"——毕竟,真正的智能,始于对数据的敬畏与理解。