数据分析-41-时间序列预测之机器学习方法XGBoost
文章目录
- 1 时间序列
-
- 1.1 时间序列特点
-
- 1.1.1 原始信号
- 1.1.2 趋势
- 1.1.3 季节性和周期性
- 1.1.4 噪声
- 1.2 时间序列预测方法
-
- 1.2.1 统计方法
- 1.2.2 机器学习方法
- 1.2.3 深度学习方法
- 2 XGBoost
-
- 2.1 模拟数据
- 2.2 生成滞后特征
- 2.3 切分训练集和测试集
- 2.4 封装专用格式
- 2.5 模型训练和预测
- 3 参考附录
1 时间序列
时间序列数据是按特定间隔记录的观测值集合,例如每小时的天气报告或每日的库存和销售报告。
时间序列为我们提供了了解历史数据的工具,并利用它们更确定地预测未来。
1.1 时间序列特点
在时间序列分析中,通常将时间序列分解为趋势、季节性、周期性和噪声这四个部分。
1.1.1 原始信号
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.tsa.seasonal import seasonal_decompose
dates = pd.date_range(start='2000-01-01'<