当前位置: 首页 > article >正文

每天五分钟玩转深度学习PyTorch:基于pytorch搭建LSTM和GRU模型

本文重点

前面我们学习了使用pytorch搭建RNN,本文我们学习如何使用pytorch搭建LSTM和GRU模型,我们来看一下,它们两个和LSTM和GRU有什么不同。

搭建LSTM

我们可以看到模型的搭建和RNN没什么区别,关键在于它的前向传播的返回值,out和hn和RNN表示的含义一样,多了一个cn,cn和hn的维度一样的都是[层数*方向,batch,hidden-size]

除此之外,LSTM和RNN的区别还体现在参数维度上,LSTM的参数维度是RNN的四倍,可以理解为wxh的维度为(hidden_len*4,feature_len)

out表示最上层每个时刻的输出,如果要是获取最后一个时刻可以[-1,::]

Cn表示最后一个时刻的长期状态(所有层),有两层的话,那么中间层也会获取到

hn表示最后一个时刻的隐藏状态(所有层)

搭建GRU

hidden的维度是[层数*方向,batch,hidden-size]

除此之外,GRU和RNN的区别还体现在参数维度上,GRU的参数维度是RNN的四倍,可以理解为wxh的维度为(hidden_len*4,feature_len)


http://www.kler.cn/a/594229.html

相关文章:

  • Python 在自然语言处理(NLP)领域的应用场景和技术实现方式
  • 计算机二级MS之Excel
  • 「实战指南 」Swift 并发中的任务取消机制
  • 95 克的工业级动能:STONE 80A-M 电调深度测评 —— 无人机动力系统的轻量化范式
  • Multisim学习-04 示波器的使用
  • wx147基于ssm+vue+uniapp的驾校预约管理系统小程序
  • 深度学习中的“刹车”:正则化如何防止模型“超速”
  • MarkPDFDown - 使用 AI 将 PDF 转录为 Markdown
  • 在 Spring Boot 中调用 AnythingLLM 的发消息接口
  • 高级java每日一道面试题-2025年3月06日-微服务篇[Eureka篇]-Eureka服务注册与发现是什么?
  • 机器学习之浅层神经网络
  • matrix-breakout-2-morpheus通关攻略
  • 云原生后端:架构、技术与未来发展
  • 「JavaScript深入」轮询(Polling):基础的实时通信方式
  • 一篇文章入门Python Flask框架前后端数据库开发实践(pycharm在anaconda环境下)
  • 目标检测中的非极大值抑制(NMS)原理与实现解析
  • Java EE 进阶:MyBatis
  • Ubuntu-server-16.04 设置多个ip和多个ipv6
  • 【动态规划】矩阵连乘问题 C++(附代码实例和复杂度分析)
  • Java集合基础知识