当前位置: 首页 > article >正文

【机器学习基础】激活函数

激活函数

  • 1. Sigmoid函数
  • 2. Tanh(双曲正切)函数
  • 3. ReLU函数
  • 4. Leaky ReLU函数

1. Sigmoid函数

在这里插入图片描述

  • 观察导数图像
  • 在我们深度学习里面,导数是为了求参数W和B,W和B是在我们模型model确定之后,找出一组最优的W和B,使我们那个模型输入的x,得出我们Y最近我们真实结果的一个Y
  • 导数函数图像,往两边走的话,它的导数越来越接近零。如果这样的情况出现的话,出现梯度消失。我们希望它的导数是一个平稳值,不要大也不要小
  • 值落在,无穷大的时候或者无穷小的时候,它的导数就接近于零,此时W和B就不能更新了,无法找到最优的W和B。你就是你不断找不找,每天也走一走个几米几米远,事实上W和B在几千米远之外

2. Tanh(双曲正切)函数

在这里插入图片描述

  • 和Sigmoid类似,优缺点也类似
  • 函数图像,值域在-1到1之间,Sigmoid在0~1之间
  • 导数图像,值域么在0到1之间,Sigmoid在0~0.25之间是吧
  • 比Sigmoid快,原因比Sigmoid0.25大,Sigmoid可能训练100轮,Tanh找50轮就够

3. ReLU函数

在这里插入图片描述

  • 分段函数,函数图像大于0为Z,小于0为0
  • 导数图像,大于0为1,小于0为0
  • 认为解决梯度消失不太严谨,因为小于0直接是0了,上两个是接近于0,直接神经元死亡。但落在大于0确实解决梯度消失,都等于1很平缓

4. Leaky ReLU函数

在这里插入图片描述

  • 对ReLU的改进
  • 函数图像大于0与ReLU相同,小于0为aZ,a≠0也≠1
  • 导数图像不为0了
  • 没有完美的激活函数,只有不合适的激活函数

http://www.kler.cn/a/369258.html

相关文章:

  • 使用pyinstaller将python代码打包为exe程序
  • JVM基础(内存结构)
  • 关闭windows更新方法
  • Java | ReentrantLock 锁和 synchronized 锁的区别和共同特点是什么?
  • JavaEE初阶---多线程(三)---内存可见性/单例模式/wait,notify的使用解决线程饿死问题
  • 面包种类图像分割系统:多层面改进
  • 项目简介——基于GD32+FreeRTOS+LVGL的智能通用控制Demo
  • 【知识科普】今天聊聊前端打包工具webpack
  • 如何应对PDF无法转换成其他格式?常见原因与解决方法解析
  • 029.爬虫专用浏览器-抓取跨域#document下的内容
  • ReactOS系统中平衡二叉树按从左到右的顺序找到下一个结点
  • 股指期货连续合约是什么意思?可以交易吗?
  • Ovis: 多模态大语言模型的结构化嵌入对齐
  • appium+mumu模拟器 嚼碎菜鸟教程
  • 酷睿 Ultra 200S核显相当于GTX 1050Ti?4核心表现出人意料
  • 一文理解平流层温度变化规律
  • Java毕业设计 基于SSM jsp餐厅卫生安全系统
  • Java中线程安全问题解决方案
  • 【软件设计】常用设计模式--代理模式
  • Leetcode 二叉树的右视图
  • cargo编译时Rust时如何自定义输出目录
  • 今年2024的1024文章
  • 微服务的发布策略与设计约束
  • springboot073车辆管理系统设计与实现(论文+源码)_kaic.zip
  • 详析STL之容器map
  • R语言笔记(四):函数