当前位置: 首页 > article >正文

机器学习实战第一天:LSTM(长短时记忆网络)

第一天是讲述LSTM大概的理论知识,知识是源自于B站李沐老师的讲解。下面我简单的总结一下LSTM的核心,因为文字不擅长表达过于细节的东西,如果有想深入了解LSTM的全部可以去B站搜索相关的视频讲解。

一、

LSTM具有很强的前后关联性,我们可以把整一个框架分成多个相同的结构通过串联组合而成,通过利用前一个结构输出的H来影响当前结构的参数的运算,F表达的是前面结构学习的东西,I 可以理解为控制当前结构学习的参数

二、

\widetilde{C} 叫做候选记忆单元,可以理解为当前结构的学习到的东西

三、

接下来是总的记忆单元组成,F是用来控制前面结构已经学习到的东西的权重,I是用来控制当前结构所学习的候选单元的权重,如果前面学习到的东西重要则F会比较大,如果当前候选单元学习到的东西有用就I比较大,反之则以,这些参数都是通过不断的迭代来更新学习。上一个的C(t-1)是前一个结构传递的记忆单元,数值会比较大,H(t-1)是前一个记忆单元经过缩放来影响当前结构的参数,两者是具有很深关联的。

四、 

H(t)是经过当前记忆单元的内容经过tanh缩放到1和-1间再点乘一个权重来进行输出,李沐老师解释了为什么要加多一个tanh,因为C(t)的计算中\widetilde{C}和C(t-1)都是已经经过tanh缩放到-1和1之间,I和F也是基于1和-1之间,所以最后的C 的取值范围是-2到2之间。需要通过tanh进行一次缩放。这个网络架构具有很深的前后记忆,但是里面又加入大量权重来防止依赖学习。

五、

LSTM通过多个相同结构组成的长短时记忆网络,C和H初始是为0,其他初始不为0

LSTM的核心内容大概就是这样了,如果博文有误还请大佬批评指正

希望这篇博文对你有帮助!!!


http://www.kler.cn/a/514752.html

相关文章:

  • element el-table合并单元格
  • 基于Redis实现短信验证码登录
  • 快手SDK接入错误处理经验总结(WebGL方案)
  • 他把智能科技引入现代农业领域
  • Apache Tomcat文件包含漏洞复现(详细教程)
  • 【CPU】RISC-V中的PMP物理内存保护单元
  • Git 如何将旧仓库迁移新仓库中,但不显示旧的提交记录
  • C语言初阶牛客网刷题——JZ17 打印从1到最大的n位数【难度:入门】
  • 【JavaSE】(8) String 类
  • 计算机怎么入门
  • 动态规划(DP)(细致讲解+例题分析)
  • ChatGPT接入苹果全家桶:开启智能新时代
  • HBased的原理
  • HDBaseT和KVM 和POE是怎么融合在一块的
  • 国产编辑器EverEdit - 文件列表
  • 08-Elasticsearch
  • 区块链的数学基础:核心原理与应用解析
  • ImportError: cannot import name ‘datapoints‘ from ‘torchvision‘
  • # [Unity]【游戏开发】 脚本生命周期与常见事件方法
  • 局域网中 Windows 与 Mac 互相远程连接的最佳方案
  • 网络编程-网络原理HTTP初识
  • 【Python】笔试面试题之生成器、闭包、字典
  • Java设计模式 九 桥接模式 (Bridge Pattern)
  • 【软件测试项目实战 】淘宝网:商品购买功能测试
  • Spring Boot 使用 Micrometer 集成 Prometheus 监控 Java 应用性能
  • R 语言科研绘图 --- 散点图-汇总