当前位置：首页 > article >正文

23- TIME-LLM: TIME SERIES FORECASTING BY REPRO- GRAMMING LARGE LANGUAGE MODELS

article 2025/2/28 15:52:27

解决问题

用LLM来解决时序预测问题，并且能够将时序数据映射（reprogramming）为NLP token，并且保持backbone的大模型是不变的。解决了时序序列数据用于大模型训练数据稀疏性的问题。

方法

Input Embedding

输入： $X^{N*T}$ ,首先对 $X_i$ 进行均方差归一化，再对 $X_i$ 进行类似卷积操作的分块，每个分块长度为 $L_p$ ，滑动步长为 $s$ ,那么分块后新的序列长度为
在这里插入图片描述
再将 $X_{p}\in{P*L_p}$ 通过线性映射层映射为 $X_{p}\in{P*d_m}$ （相当于将每个段时序信息的数据映射为一个embeding，来描述该时段的信息）。

Patch Reprogramming

将时序数据进行数据对齐，为nlp能理解的信息
文中学习一个 $E'\in{V'*D}$ ，其中 $V^{'}$ 远小于原词典大小，这样可以提升效果。 $E^{'}$ 在模型中进行学习，学习词典与path的相关性信息。
在这里插入图片描述

再将 $E^{'}$ 作为attention中的V和K，path embedding作为attention中的Q，这样就可以得到path与每个nlp token之间的相关性。
在这里插入图片描述

Prompt-as-Prefix.

同时在序列特征前面构造一些提示词信息，来帮助学习。

在打包和前馈时，prompt and patch嵌入 $O_i$ , 通过如图2所示的冻结LLM，我们丢弃前置Prompt-as-Prefix部分并获得输出表示。在此之后，将它们展平并线性投影，以得出最终预测 $Y_i$ . （丢弃指得是只用他们来计算attention吗，最终输出的embedding表示丢弃掉？）
在这里插入图片描述