当前位置: 首页 > article >正文

门控循环单元(GRU)

困死了。。。
参考视频:56 门控循环单元(GRU)【动手学深度学习v2】
GRU:门控循环单元,与LSTM类似,解决RNN中不能长期记忆和反向传播中的梯度等问题。但结构比LSTM简单。
关注一个序列,不是每个观察值都是同等重要,想只记住相关的观察需要:
能关注的机制(更新门)
能遗忘的机制(遗忘门)

更新门与遗忘门

在这里插入图片描述
更新门帮助模型决定到底要将多少上一层的信息传递到现在,即前一时间步和当前时间步的信息有多少是需要继续传递的
上述公式中,更新门的操作为:
xt(当前时间步所输入向量)经过一个线性变换后与上一时间步保存的信息ht-1也经过一个线性变换后相加后再加一个常量后进入 Sigmoid 激活函数,输出的值为0-1之间。

重置门主要决定了到底有多少过去的信息需要遗忘。
上述公式中,遗忘门的操作:
与更新门类似,ht-1与xt各自进行了一个线性变换后 加上一个常量后进入Sigmoid 激活函数。

候选隐状态

在这里插入图片描述
简单来说,就是当前信息和对过去信息的筛选。
其中Rt与Ht-1的对应元素乘积:重置门的输出值均为0-1,代表了该信息的的相关程度,例如某个元素对应的门控值为 0,那么它就代表这个元素的信息完全被遗忘掉。

隐状态

在这里插入图片描述
最终记忆的计算过程中,需要使用更新门,它决定了当前记忆内容 ht和前一时间步 ht 中需要收集的信息。
Zt为更新门的激活结果,它同样以门控的形式控制了信息的流入。Zt与 ht 的对应元素乘积表示前一时间步保留到最终记忆的信息,该信息加上当前记忆保留至最终记忆的信息就等于最终门控循环单元输出的内容。


http://www.kler.cn/a/313216.html

相关文章:

  • 【前端】Vue中如何避免出现内存泄漏
  • 在 Ubuntu 上安装 `.deb` 软件包有几种方法
  • AI 写作(五)核心技术之文本摘要:分类与应用(5/10)
  • 知识库管理系统:企业数字化转型的加速器
  • 深度学习——权重初始化、评估指标、梯度消失和梯度爆炸
  • 【JAVA】正则表达式中的中括弧
  • MySQL高阶1873-计算特殊奖金
  • 【JS】ESMoudle机制与符号绑定
  • 传知代码-多示例AI模型实现病理图像分类
  • 加密与安全_HTTPS TLS 1.2 连接(RSA 握手)的整个过程解读
  • 前端面试CSS常见题目
  • 机器学习之非监督学习(四)K-means 聚类算法
  • 【Docker Nexus3】maven 私库
  • JAVA8新特性——Optional
  • Dockerfile部署xxljob
  • FactualSceneGraph场景图生成
  • OpenAI或于9月24日发布ChatGPT高级语音模式
  • 小白src挖掘 | 记某证书站的虚拟仿真实验平台
  • 提升效率的AI工具集 - 轻松实现自动化
  • ValueError: pic should not have > 4 channels. Got XXX channels.
  • navicat无法连接远程mysql数据库1130报错的解决方法
  • 书生·浦语作业集合
  • AI学习指南深度学习篇-Adam超参数调优与性能优化
  • 神经网络推理加速入门——一个例子看懂流水
  • Redis基础(数据结构和内部编码)
  • (黑马点评)八、实现签到统计和uv统计