当前位置: 首页 > article >正文

【深度学习】RNN循环神经网络的原理

        sentiment analysis,根据评价来判断为好评还是差评。例如I hate this boring movie,每个单词都用一个张量[100]进行表示,整句话就可以用张量[5, 100]进行表示。每个单词经过线性层操作之后(w和b的shape为[100, 2]),与线性层相连接提取特征,抽取高层特征,会得到一个张量[2],经过加和计算可以得到张量[5, 2],进而得到概率值P(pos|x)判断评论的好坏属性。

    但是这样的方法存在问题,当句子太长的时候,[w,b]的参数太多。这时候我们可以采用权值共享的方法,把所有的[w, b]用同一个值进行处理,这样会大大减少参数量。

        而且没有一个上下语境信息,我们不能一个一个的单词进行处理,而需要看整体的句子,需要持续的协调一致的张量(consistent tensor),存储统一的语境信息。首先,初始化h0,第一个单词不仅输入输入的特征向量 “I”,还输入初始值h0的特征向量;第二个单词,输入 “hate”的同时,也输入上一时刻的语境信息 h1;第三个单词,输入 “this”的同时,也输入上一时刻的语境信息 h2。

        简化之后,可以得到如果输入特征为[5, 3, 100],一句话有5个单词,有三个句子batch,每个单词用100维的特征向量进表示,输入一句话的时候shape为[3, 100],然后进行不断自我更新,自我更新机制取决于上一时刻的输出和当前输入。

        展开之后可以得到: 

          如何进行训练RNN呢?


http://www.kler.cn/a/466662.html

相关文章:

  • wordpress右侧浮动咨询台插件
  • 计算机网络--路由表的更新
  • 嵌入式linux中socket控制与实现
  • [答疑]用例规约:系统请求3dsMax创建体块
  • 【ArcGISPro/GeoScenePro】检查多光谱影像的属性并优化其外观
  • SpringBoot Maven 项目 pom 中的 plugin 插件用法整理
  • Golang的代码质量分析工具
  • C# 设计模式(结构型模式):组合模式
  • 基于jQuery的图片浏览插件(1)
  • 探索新一代框架:基于ECS架构的轻量化Web开发
  • C# 设计模式(结构型模式):桥接模式
  • 2024年大型语言模型(LLMs)的发展回顾
  • DataCap 2024.4.1 版本发布:MongoDB 驱动支持、工作流引擎升级
  • Selenium 浏览器驱动代理 - 无需下载本地浏览器驱动镜像!(Java 版本!)
  • JavaEE 前后端交互与数据库连接练习
  • mybatisPlus拦截sql失败----已解决
  • basic-validation-using-flask-gladiator-module-in-python
  • APM 3.0.2 | 聚合B站、油管和MF的音乐播放器,支持歌词匹配
  • 2025 小模型技术:驱动低代码与物联网融合发展新引擎
  • Markdown段落的空行缩进用法
  • STM32 拓展 RTC(实时时钟)
  • 前端,npm install安装依赖卡在sill idealTree buildDeps(设置淘宝依赖)
  • ElasticSearch11-8.x 新特性
  • JupyterLab notebook环境在Ubuntu24.04下的安装和Windows 10下vscode远程使用jupyter
  • 鸿蒙应用开发搬砖经验之—使用DevTools工具调试前端页面
  • SpringBoot + Vue 项目创建详细步骤