当前位置：首页 > article >正文

多元时间序列预测的范式革命：从数据异质性到基准重构

article 2025/3/18 23:23:13

本推文介绍了一篇来自中国科学院计算技术研究所等机构的论文《Exploring Progress in Multivariate Time Series Forecasting: Comprehensive Benchmarking and Heterogeneity Analysis》，发表在《IEEE Transactions on Intelligent Transportation Systems》。论文针对多变量时间序列（MTS）预测中实验结果不一致、技术方向选择困难等问题，提出了首个专门为MTS预测设计的基准框架BasicTS+，通过统一训练流程和评估标准，实现了45种模型在20个数据集上的公平对比。

研究首次揭示了MTS数据集的异质性特征，根据时间序列的稳定性和空间依赖程度将数据集分为三大类，并发现模型性能与数据特征密切相关：例如Transformer模型在具有稳定周期模式的数据集上表现优异，而简单线性模型在分布漂移或无明确模式的数据中更具优势。实验结果表明，现有模型的有效性高度依赖数据类型，盲目套用结论可能导致误判。该研究不仅为MTS预测提供了可靠的评估工具，还为模型选择和数据集设计提供了理论依据，为复杂系统如交通、能源领域的时间序列分析奠定了方法论基础。

论文链接：https://ieeexplore.ieee.org/abstract/document/10726722

代码与数据集：https://github.com/GestaltCogTeam/BasicTS

一、领域困境：实验结果为何"打架"？

在交通、能源等复杂系统的智能决策中，多元时间序列（MTS）预测扮演着核心角色。然而，当前研究存在两大痛点：

（1）结论矛盾：同一模型在不同研究中表现差异显著（如DCRNN在PEMS04的MAE波动达33%）

（2）方法困惑：Transformer与线性模型的优劣之争持续数年，STGNN的必要性饱受质疑

中国科学院计算技术研究所团队在《IEEE Transactions on Knowledge and Data Engineering》发表的最新研究，首次系统性揭示了这些矛盾背后的根本原因——数据异质性，并构建了首个公平可比的基准框架BasicTS+。

二、核心突破：BasicTS+基准框架

2.1 BasicTS+框架及基本流程

图1展示了BasicTS+的框架，其中主要包括BasicTS+的核心组件和用户配置文件两部分。

图1 BasicTS+的框架

BasicTS+框架的基本流程如下：

（1）数据预处理：强制Z-score归一化，自动添加时间戳、星期几等10+外部特征

（2）训练策略：采用掩码MAE损失函数，整合课程学习与梯度裁剪技术

（3）评估标准：提供MAE/RMSE/MAPE/WAPE等8维度指标，支持归一化与反归一化双重验证

通过标准化数据加载、训练运行与评估流程，BasicTS+实现了45种模型在20个数据集上的公平对比。实验显示，统一标准使模型性能平均提升25%，消除了因实验设置差异导致的误判。

2.2 数据异质性分类体系

研究首次提出MTS数据的双维度分类标准：

（1）图2展示了以时间特征维度MTS数据的分类标准，为稳定周期模式、分布漂移模式和无明确模式，分别对应PEMS03/04/08、ETTh2/ETTm2和ExchangeRate典型数据集。

图2 多个MTS数据集中的不同时间模式

（2）图3展示了以空间特征维度MTS数据的分类标准，为高不可区分性、低不可区分性，分别对应METR-LA/BAY、ETTm1/ETTm2典型数据集。

图3 不同数据集中的空间不可区分性

三、颠覆性发现：数据决定模型命运

3.1 时间维度的"模型适配法则"

（1）稳定周期数据：表1中可以看出，Transformer架构（如FEDformer）通过捕捉多尺度周期性，在PEMS04的MAE达26.89，较线性模型低39.49%

（2）分布漂移数据：表1中可以看出，线性模型（DLinear）因抗过拟合能力，在ETTh2的MAE仅3.13，优于Transformer的3.27

（3）无明确模式数据：所有模型性能相近，凸显预测本质困难

表1 高级模型和基线模型在异构MTS数据集中的性能

3.2 空间维度的"建模边界"

（1）高不可区分性数据：表2中可以看出，STID通过空间身份嵌入，在METR-LA的MAE达3.12，较移除空间模块的STID*降低12.85%

（2）低不可区分性数据：表2中可以看出，保留GCN的AGCRN在ETTm1的MAE反而比AGCRN*高21.16%

表2 STID、AGCRN及其变体在具有不同空间不可区分性的数据集上的性能

表2呈现了STID、AGCRN及其变体在不同空间不可区分性数据集上的性能差异：在空间不可区分性高的LA、BAY数据集中，含空间依赖模块的STID、AGCRN表现更优；而在空间不可区分性低的ER、ETTm1数据集中，去掉空间模块的变体（STID*、AGCRN*）性能更突出，如ER数据集MAPE指标中，变体较原模型下降25.31%。Gap数据进一步表明，空间依赖模块在低空间不可区分性数据集中会导致性能损失，验证了研究中“模型空间建模需适配数据空间异质性”的结论——高空间不可区分性数据适合依赖空间模块的模型，低空间不可区分性数据无需复杂空间建模，凸显模型与数据空间特征适配的关键作用。