数据分析-26-时间序列预测之基于ARIMA的时间序列数据分析
文章目录
- 1 数据加载
- 2 数据集划分
- 3 ARIMA模型
-
- 3.1 自回归((AR))成分【阶数p】
- 3.2 差分(I)成分【阶数d】
- 3.3 移动平均(MA)成分【阶数q】
- 3.4 确定pdq参数
-
- 3.4.1 PACF图(确定p)
- 3.4.2 ADF平稳性检验(确定d)
- 3.4.3 ACF图(确定q)
- 3.5 模型拟合与预测
-
- 3.5.1 模型残差检验
- 3.5.2 模型预测
- 4 参考附录
1 数据加载
国际旅行旅客人数数据集——international-airline-passengers。
参考international-airline-passengers.xlsx数据下载链接
(1)首先,我们导入了必要的Python库,包括用于处理数据的pandas、用于绘图的matplotlib.pyplot、以及用于时间序列建模的statsmodels;
(2)然后使用pandas库的read_excel方法读取Excel格式的数据集;
(3)再使用pd.to_datetime()将Month列转换为日期时间类型,这样做是为了确保时间序列的索引是日期类型;
(4)最后使用set_index()方法将Month列设置为数据框的索引,这一步是关键,因为时间序列分析要求数据按时间顺序排列。
import numpy as np
import pandas as pd
import matplotlib.py