当前位置: 首页 > article >正文

Transformer的前世今生 day02(神经网络语言模型

神经网络语言模型

  • 使用神经网络的方法,去完成语言模型的两个问题,下图为两层感知机的神经网络语言模型:
    在这里插入图片描述

以下为预备概念

感知机

  • 线性模型可以用下图来表示:输入经过线性层得到输出
    在这里插入图片描述
  • 线性层 / 全连接层 / 稠密层:假设输入有n个,输出有m个,则w、b、y的个数如下:
    在这里插入图片描述

独热编码

  • 目的是让计算机认识单词
  • 用矩阵的形式,存储所有单词。且在矩阵中,每一个元素都代表一个单词,这就要求矩阵的行列等于单词数,如下图:
    在这里插入图片描述
  • 独热编码有两个缺点:
    • 矩阵的尺寸很容易过大,因为他需要行列等于单词数
    • 相似单词之间的独热编码没有任何关联,通常使用余弦相似度来计算文本之间的相似度,但是现实世界中相似单词之间是有关联的

http://www.kler.cn/a/272166.html

相关文章:

  • OSPF协议部分解读
  • 美特CRM mcc_login.jsp存在SQL注入漏洞
  • Docker 学习总结(85)—— docker cp 使用总结
  • 蓝桥杯3525 公因数匹配 | 枚举+数学
  • 移远通信多模卫星通信模组BG95-S5获得Skylo网络认证,进一步拓展全球卫星物联网市场
  • 什么是SSL及SSL的工作流程
  • 【开源鸿蒙】模拟运行OpenHarmony轻量系统QEMU RISC-V版
  • uwsgi+nginx+django 部署学习
  • cache的58问,您能回答上几个
  • 课时67:流程控制_for循环_for基础
  • 万界星空科技商业开源MES,技术支持+项目合作
  • vulhub中GitLab 任意文件读取漏洞复现(CVE-2016-9086)
  • MATLAB中的cell数组和结构体。
  • 安全地使用v-html
  • 深度学习pytorch——基本运算(持续更新)
  • 微信小程序之tabBar
  • LinkedList源码解析和设计思路
  • 强大的开源网络爬虫框架Scrapy的基本介绍(入门级)
  • 在类Unix平台实现TCP客户端
  • linux ---vim的基本使用
  • 单片机第四季-第二课:uCos2源码-BSP
  • ChatGPT :确定性AI源自于确定性数据
  • UGUI界面性能优化2-最大程度降低UI的DrawCall和重绘
  • RabbitMQ——死信队列和延迟队列
  • windows安装go
  • Xcode 15.3 Archive失败