当前位置: 首页 > article >正文

深度学习---------------------------深度循环神经网络

目录

  • 回顾:循环神经网络
  • 总结
  • 深度循环神经网络代码

回顾:循环神经网络

在这里插入图片描述
在这里插入图片描述

RNN就一个隐藏的层,无法做的很宽,所以一般的做法是做的更深。(更深的时候是说每一层做一点点的非线性。)

怎么样把循环网络变深?怎么样获得更多的非线性

多加几个隐藏层

在这里插入图片描述



更深:

在这里插入图片描述
在这里插入图片描述
当前的第一个隐藏层 H t 1 H_{t}^{1} Ht1,第j层就是 H t j H_{t}^{j} Htj等于 f j f_j fj下(第j层的上一个时刻的H,第j-1层时刻的隐藏状态)




总结

深度循环神经网络使用多个隐藏层来获得更多的非线性性。




深度循环神经网络代码

from torch import nn
from d2l import torch as d2l

batch_size, num_steps = 32, 35
# 将数据集划分为以batch_size为批量大小,num_steps为时间步数的小批量数据
train_iter, vocab = d2l.load_data_time_machine(batch_size, num_steps)
# 设置隐藏层数为2,即num_layers
vocab_size, num_hiddens, num_layers = len(vocab), 256, 2
# 将输入的维度设置为词汇表的大小,用于将词汇表中的词转换为嵌入向量
num_inputs = vocab_size
device = d2l.try_gpu()
# 创建 LSTM 层
lstm_layer = nn.LSTM(num_inputs, num_hiddens, num_layers)
model = d2l.RNNModel(lstm_layer, len(vocab))
model = model.to(device)
num_epochs, lr = 500, 2
d2l.train_ch8(model, train_iter, vocab, lr, num_epochs, device)
d2l.plt.show()

在这里插入图片描述
在这里插入图片描述


http://www.kler.cn/a/329255.html

相关文章:

  • RTMP|RTSP播放器只解码视频关键帧功能探讨
  • Qt基础项目篇——Qt版Word字处理软件
  • AI 新动态:技术突破与应用拓展
  • 数据分析 基础定义
  • FPGA开发中的团队协作:构建高效协同的关键路径
  • vue3+ts+uniapp 微信小程序(第一篇)—— 微信小程序定位授权,位置信息权限授权
  • 浅谈计算机神经网络基础与应用
  • MySQL vs PostgreSQL:2024年深度对比与选择指南
  • Kotlin:1.8.0 的新特性
  • 开源23.6k star 一款即用型 OCR,支持 80+ 种语言和所有流行的书写脚本,只需几行代码即可实现文字识别功能。
  • 网易云多久更新一次ip属地
  • Java研学-BootStrapTable插件
  • $_POST = file_get_contents(“php://input“);是什么意思
  • C语言指针详解与应用(不断更新)
  • MongoDB 入门及实践
  • 【cache】浅析四种常用的缓存淘汰算法 FIFO/LRU/LFU/W-TinyLFU
  • MongoDB 聚合管道
  • Springboot3 + MyBatis-Plus + MySql + Vue + ProTable + TS 实现后台管理商品分类(最新教程附源码)
  • Webpack和GuIp打包原理以及不同
  • IDM下载器如何下载网盘文件 IDM下载器支持哪些网盘
  • 【数据库】Java 集成mongodb— MongoTemplate 详解
  • OpenCV图像文件读写(6)将图像数据写入文件的函数imwrite()的使用
  • YOLO11改进|卷积篇|引入可变核卷积AKConv
  • 程序计数器(学习笔记)
  • Docker 进入容器运行命令的详细指南
  • “图像识别技术:重塑生活与工作的未来”