数据分析-11-时间序列分析的概念任务和主要方法
1 时间序列
1.1 时间序列的定义
时间序列,通俗的字面含义为一系列历史时间的序列集合。比如2013年到2022年我国全国总人口数依次记录下来,就构成了一个序列长度为10的时间序列。
结合上图理解随机变量和观测值的关系。
我们认为每个时间点发生的数据都来自于一个分布的,即时序点是个随机的变量,如上图中所示,在未发生之前每个时序点有可能是红色,也有可能是蓝色。而一旦发生了就会成为一个事实,会变成历史,所以就只能存在一个唯一的数据。
这里的红色点就是观测点,是我们现实世界某个时刻我们肉眼看到的数据,而蓝色点则是随机变量里可能会出现的其他数据。蓝色和红色点一起组合了发生时刻的一个变量分布。拿股价举例,收盘之前的价格我们认为会在一个合理的分布区间之内浮动,但不到收盘结束谁都不知道具体是多少,可能是红色或者蓝色,一旦到了收盘就必然会有一个唯一的价格。