当前位置: 首页 > article >正文

【机器学习】20. RNN - Recurrent Neural Networks 和 LSTM

1. RNN定义

  • 用于顺序数据

  • 文本数据是序列数据的一个例子

  • 句子是单词的序列——一个单词接另一个单词

  • 每个句子可能有不同数量的单词(长度可变)

  • 每个句子之间可能有长距离的依赖关系

  • rnn可以记住序列中较早的相关信息

  • RNN在每个时间点取序列中的1个元素。

  • 神经元在某一个时间点的输出,在下一个时间点(或另一个时间点)反馈给同一神经元

  • 结果:RNN对过去的激活有记忆(因此过去的输入促成了这些激活)

  • RNN可以捕获长距离依赖->对序列有用

2. 简单RNN

在这里插入图片描述

简单RNN含有由1个隐藏层构成的前馈神经网络, 这个隐藏层特别的, 含有一个记忆缓存, 会存储隐藏层之前一个时间步的状态. 在每一个时间步, 记忆缓存中的数据会和下一组输入结合作为隐藏层神经元的下一次输入.

  • unroll 图

来源“https://blog.csdn.net/v_JULY_v/article/details/89894058?ops_request_misc=%257B%2522request%255Fid%2522%253A%252254B767C0-D690-48B6-8C5B-F58DE48F7D38%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=54B767C0-D690-48B6-8C5B-F58DE48F7D38&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2alltop_positive~default-1-89894058-null-null.142v100pc_search_result_base9&utm_term=RNN&spm=1018.2226.3001.4187

图片来源:https://blog.csdn.net/v_JULY_v/article/details/89894058

RNN 会受到短时记忆的影响。如果一条序列足够长,那它们将很难将信息从较早的时间步传送到后面的时间步。

在递归神经网络中,获得小梯度更新的层会停止学习—— 那些通常是较早的层。 由于这些层不学习,RNN会忘记它在较长序列中以前看到的内容,因此RNN只具有短时记忆。

在反向传播过程中, 误差梯度会在每个时间步中与w_hh 多次相乘, 如果这些权重过小, 这种多次相乘会导致梯度逐渐变得非常小, 最终几乎消失
而梯度爆炸则是因为计算的难度越来越复杂导致。

LSTM,可以在一定程度上解决梯度消失和梯度爆炸这两个问题

3. LSTM

4张图,直接了解完LSTM

3.1. 忘记门

忘记门会读取上一个输出h_{t-1}和当前输入x_{t},做一个Sigmoid 的非线性映射,然后输出一个向量f_{t}
在这里插入图片描述

3.2. 输入门

在这里插入图片描述

3.3 细胞状态

在这里插入图片描述

3.4. 输出门

在这里插入图片描述
C 是细胞状态


http://www.kler.cn/a/375390.html

相关文章:

  • 基于SpringBoot的健身房系统的设计与实现(源码+定制+开发)
  • 数字IC后端实现之Innovus Place跑完density爆涨案例分析
  • 静态路由实现路由互通
  • 硅谷甄选(11)角色管理
  • 【C++动态规划 01背包】2787. 将一个数字表示成幂的和的方案数
  • Flutter-Engine 的定制实践:Text 绘制流程浅析及自定义underline的间距
  • 力扣题目解析--正则表达式匹配
  • 麒麟V10SP1部署postgresql+postgis+pgrouting
  • 从同样一个简单的计算问题,看星火4.0 Turbo模型推理逻辑能力
  • 小张求职记二:完善简历
  • 【CSS】——基础入门常见操作
  • 如何在 Ubuntu 16.04 上使用 UFW 设置防火墙
  • VsCode显示空格
  • 移远通信推出八款天线新品,覆盖5G、4G、Wi-Fi和LoRa领域
  • const对象仅在文件内有效的问题
  • 探讨Facebook的AI研究:未来社交平台的技术前瞻
  • 机器视觉中光源镜头和相机的关系
  • Django数据模型on_delete属性值
  • 大厂面试真题-很多系统会使用netty进行长连接,连接太多会有问题吗
  • Linux中部署PostgreSQL保姆级教程
  • 实习冲刺Day10
  • 【CSS】CSS 样式重置 (normalize.css 和 reset.css) 和通用样式配置
  • 虚拟现实与增强现实:重塑娱乐和教育的边界!
  • Pytest-Bdd-Playwright 系列教程(6):在测试步骤函数中设置别名数据共享
  • 校园社团信息管理:Spring Boot技术的优势与实现
  • 提升用户体验优化全攻略