数据分析-48-时间序列变点检测之在线实时数据的CPD
文章目录
- 1 时间序列结构
-
- 1.1 变化点的定义
- 1.2 结构变化的类型
-
- 1.2.1 水平变化
- 1.2.2 方差变化
- 1.3 变点检测
-
- 1.3.1 离线数据检测方法
- 1.3.2 实时数据检测方法
- 2 模拟数据
-
- 2.1 模拟恒定方差数据
- 2.2 模拟变化方差数据
- 3 实时数据CPD
-
- 3.1 SDAR学习算法
- 3.2 Changefinder模块
- 3.3 恒定方差CPD
-
- 3.3.1 查看变点得分
- 3.3.2 绘制变点图(简单排序法)
- 3.3.3 绘制变点图(归并排序法)
- 3.4 变化方差CPD
- 4 变点的处理策略
-
- 4.1 差分法
- 4.2 虚拟变量法
- 5 参考附录
1 时间序列结构
1.1 变化点的定义
平稳性是时间序列分析与预测的核心概念。在平稳条件下,时间序列的统计特性(如均值)在时间维度上保持不变,仅存在随机波动。
但是实际数据集中很少观察到完全的平稳性。时间序列通常会经历结构性断裂或变化,这些变化会引入非平稳性,从而改变时间序列的整体分布,这些标志着变化开始的时间点被称为变化点。
假设你正在进行运动时,使用数字设备监测心率。你先跑了四分之一公里,然后走了十分钟,接着又跑了四分之一公里里。可能你的心率情况与图中的时间序列相似。上图中展示了一段高心率、一段低心率,然后又回到高心率。时间序列的突然变化提示我们,你的活动状态发生了重大变化。
但需要注意的是,结构变化与异常值是两个不同的概念。
(1)异常值是指与时间序列的基本结构或分布所定义的正常行为显著偏离的观测值。
(2)变化点则是指时间序列的整体结构发生转变&#