当前位置：首页 > article >正文

【SegRNN 源码理解】self.revIN可逆实例标准化

article 2025/3/13 9:00:08

       if self.revin: #self.revin =  1  （休止符）
            x = self.revinLayer(x, 'norm').permute(0, 2, 1) # b,s,c -> b,c,s # goto

也是一种标准化

是什么
两次标准化
分布偏移
实例归一化

实例归一化

分布偏移

计算方法

# 归一化步骤
x = (x - mean) / std  # 消除分布偏移

# 在预测后的反归一化步骤
y = y * std + mean  # 恢复原始数据分布

RevIN的工作原理：

实例级归一化：
- 不同于全局标准化，RevIN对每个输入序列单独计算统计量
- 针对每个通道（特征）分别处理
可逆设计：
- 保存归一化参数（均值和标准差）
- 允许在预测后"反归一化"，恢复原始数据分布的特性
保留模式而消除分布：
- 消除绝对水平和尺度的影响
- 让模型专注于学习序列的相对变化模式

举例说明：

假设有两个季节的疾病数据，夏季感染率在0-10范围，冬季在50-60范围：

应用RevIN后：

是什么

这段代码完成两个关键操作：

1. 数据归一化处理 (RevIN)

self.revinLayer(x, 'norm') 调用了 RevIN (Reversible Instance Normalization) 层对输入数据进行归一化：

RevIN 是什么：一种专为时间序列设计的可逆归一化技术，可以处理非平稳时间序列中的分布偏移问题
工作原理：对每个实例(样本)的每个通道分别进行归一化

为什么需要：与数据加载时的全局标准化不同，RevIN 对每个序列单独归一化，处理序列内部的分布变化
可逆特性：RevIN 保存归一化参数，在模型输出时可以"反归一化"，恢复原始分布

2. 维度变换 (permute)

.permute(0, 2, 1) 改变了张量的维度顺序：

输入形状：[batch_size, seq_len, channels] 简写为 [b, s, c]
- 例如 [16, 60, 7]：16个样本，每个60个时间步，每个时间步7个特征
输出形状：[batch_size, channels, seq_len] 即 [b, c, s]
- 变为 [16, 7, 60]：16个样本，7个特征通道，每个通道60个时间步
变换目的：
1. 将特征/通道维度提到第二维，便于后续按通道处理数据
2. 为分段操作做准备，让时间维度在最后，便于后续分段处理
3. 符合许多深度学习库的惯例，如卷积操作通常期望通道在第二维

更具体的例子：16 个批次，60 个时间步，每个时间步 7 个特征

全局标准化

http://www.kler.cn/a/576544.html

相关文章：

Elasticsearch：“Your trial license is expired”

乐鑫打造全球首款 PSA Certified Level 2 RISC-V 芯片

Qt 实现绘图板（支持橡皮擦与 Ctrl+Z 撤销功能）[特殊字符]

React Native 0.76 升级后 APK 体积增大的原因及优化方案

linux的文件系统及文件类型

护照阅读器在旅游景区流程中的应用

深度学习网格搜索实战

GPO 配置的 4 种常见安全错误及安全优化策略

机器学习（李宏毅）——Life-Long Learning

在 Docker 中安装并配置 Nginx

Service 无法访问后端 Pod，如何逐步定位问题

C++ `bitset` 入门指南

蓝桥杯P17153-班级活动题解

Elastic如何获取当前系统时间

【算法方法总结·四】字符串操作的一些技巧和注意事项

Chrome 扩展开发：Chrome 扩展的作用和开发意义（一）

Ollama 框架本地部署教程：开源定制，为AI 项目打造专属解决方案！

网络与网络安全

每天记录一道Java面试题---day28

3.6 登录认证