当前位置: 首页 > article >正文

每天五分钟深度学习框架pytorch:常见神经网络层的维度信息总结

全连接神经网络输入[batch,输入层单元数]

全连接神经网络输出[batch,输出层单元数]

embedding接收[word1,word2,...],它的shape为[文本单词数]

embedding输出shape为[文本单词数,embedding编码维度]

构建训练数据的时候,样本特征为[[样本1],[样本2],[样本3]],它的shape为[样本数,每个样本的特征数]

样本特标签tag为[标签1,标签2,标签3...],它的shape为[样本数]

而神经网络的输出out的shape=[样本数,分类类别]

所以out要是想要和tag计算损失,tag应该会根据自己的实际类别,变成ont-hot的形式

比如说10分类的问题

我们可以看到这个实例,当batch=1的时候,神经网络的输出维度为[1,10],然后tag的维度为[1],这两个要计算损失

卷积神经网络接收[batch,通道数,长,宽]

当填充为1,步长为1,卷积核大小是3时,图片大小不变


http://www.kler.cn/a/588433.html

相关文章:

  • Linux mount和SSD分区
  • 垃圾回收机制是什么 ?JVM 核心结构?
  • Linux-进程概念
  • 麒麟服务器操作系统Sqlite部署手册
  • 笔记:代码随想录算法训练营day48:739. 每日温度\496.下一个更大元素 I\503.下一个更大元素II
  • 【专项测试】限流测试
  • Java算法OJ(12)
  • Vue 3 组件库主题化与可扩展性深度剖析:设计模式与实现策略 - 构建灵活适应多场景的组件库架构
  • Java缓存String(字符串常量池)、Integer (-128 到 127 )
  • 计算机基础:二进制基础12,十进制数转换为十六进制
  • 联想台式电脑启动项没有U盘
  • 【医学影像 AI】大型语言模型生成 ROP 患者信息材料的能力
  • 编程题《牛牛的链表删除》的python可以用非链表的方式
  • 某省政务信创案例:3阶段实施×5类工具链选型经验分享
  • Word 小黑第18套
  • 用DasViewer的时候3Dtiles 转osgb 可以直接指定目标坐标系吗?
  • 【c++】【智能指针】什么情况下不适合智能指针
  • C++之stack_queue扩展
  • 【VUE】day04-组件的生命周期、组件之间的数据共享、ref引用、购物车案例
  • Axure高级功能深度解析一一高效原型设计的利器