当前位置: 首页 > article >正文

PyTorch学习笔记之激活函数篇(五)

5、PReLU函数

对应的论文链接:https://arxiv.org/abs/1502.01852v1

5.1 公式

PReLU函数的公式:
f ( x ) = { x , x > = 0 α x , x < 0 ( α 是可训练参数 ) f(x) = \begin{cases} x&,x>=0 \\ \alpha x&,x<0 (\alpha 是可训练参数) \end{cases} f(x)={xαx,x>=0,x<0(α是可训练参数)
PReLU函数的导函数:
f ′ ( x ) = { 1 , x > = 0 α , x < 0 ( α 是可训练参数 ) f'(x) = \begin{cases} 1&,x>=0 \\ \alpha &,x<0 (\alpha 是可训练参数) \end{cases} f(x)={1α,x>=0,x<0(α是可训练参数)

5.2 优点与不足

PReLU函数(ReLU的改进):
1、在负值域,PReLU的斜率较小,这也可以避免Dead ReLU问题。与ELU相比,PReLU在负值域是线性运算。尽管斜率很小,但不会趋于0。
2、公式与Leaky ReLu相似,但并不完全一样。𝛼可以是常数,或自适应调整的参数。也就是说,如果让a自适应,那么PReLu会在反向传播时更新参数a。
3、参数α通常为0到1之间的数字,并且通常相对较小。
(1)如果𝛼 = 0,则f(x)变为ReLU。
(2)如果𝛼 > 0,则f(x)变为leaky ReLU。
(3)如果𝛼是可学习的参数,则f(x)变为PReLU。

5.3 torch.rpelu

在 PyTorch 中,torch.rrelu 函数用于实现随机泄露修正线性单元(Randomized Leaky ReLU)激活函数。RReLU 是 Leaky ReLU 的一个变体,其中负输入值的斜率是在训练过程中随机采样的,并在每次前向传播时保持固定。这种随机性有助于模型的正则化,因为它在每次迭代时都会稍微改变激活函数的形状。

torch.rrelu 的基本使用如下:

import torch

# 创建一个张量
x = torch.tensor([-5.0, -3.0, 0.0, 2.0, 5.0])

# 应用 RReLU 函数
# 下面的例子中,我们假设负斜率的均值是 0.01,标准差是 0.02
y = torch.rrelu(x, lower=0.01, upper=0.02)

print(y)

在上面的例子中,lower 和 upper 参数定义了负斜率随机采样的范围。lower 是斜率的最小值,而 upper 是斜率的最大值。每次前向传播时,负斜率会在这个范围内随机选择一个值,并保持不变,直到下一次前向传播。


http://www.kler.cn/a/273853.html

相关文章:

  • MySQL - 子查询和相关子查询详解
  • Perturbed-Attention Guidance(PAG) 笔记
  • halcon三维点云数据处理(七)find_shape_model_3d_recompute_score
  • 这是什么操作?强制迁移?GitLab 停止中国区用户访问
  • 如何监控批量写入的性能瓶颈?
  • 计算机网络基础——网络协议
  • vue3.0组件API风格以及组合式API响应式基础
  • 一款基于 SpringCloud 开发的AI聊天机器人系统,已对接GPT-4.0,非常强大
  • 电学基础知识
  • macbook删除软件只需几次点击即可彻底完成?macbook删除软件没有叉 苹果笔记本MacBook电脑怎么卸载软件? cleanmymac x怎么卸载
  • 4.GetMapping和PostMapping 和 @RequestMapping的区别。RequestBody 和ResponseBody的区别
  • Java面向对象特征(二)----- 继承
  • flinksql在实时数仓hologres的计算问题排查
  • 2024-3-18-C++day6作业
  • 抖音无水印视频关键词批量下载|视频下载工具
  • 青海200MW光伏项目 35kV开关站图像监控及安全警示系统
  • 蓝桥杯算法基础(24):多维数组与矩阵(4道小题)java版
  • [日报] Ribbon、Eureka、Nginx、负载均衡
  • 深入理解Apache Kafka Topic:架构设计与应用场景
  • 【Linux】日常使用命令(三)
  • 保护你的微服务:Sentinel熔断器的原理与应用解析(二)
  • 【vue】深入探讨vue中组件间多种传值方式
  • 蓝桥杯C++大学B组一个月冲刺记录2024/3/18
  • 【DL经典回顾】激活函数大汇总(二十一)(BReLU附代码和详细公式)
  • 身份证文字识别ocr免费-身份证实名认证接口-护照识别-Java调用代码
  • 【ADF4351】使用FPGA进行SPI寄存器配置、使用FPGA计算各个频率的频点,ADF4351配置程序