当前位置: 首页 > article >正文

LLM的原理理解1-5:1、词向量2、词的意义取决于上下文3、将词向量转化为词预测4、​注意力机制​

目录

LLM的原理理解1-5

1、词向量

2、词的意义取决于上下文

3、将词向量转化为词预测

4、​注意力机制​

Q查询向量:描述它寻找的词的特征。

K关键向量:描述它自己的特征。

多注意头:一词多义的含义

5、一个真实世界的例子

移动头(Name Mover Head)

主语抑制头


LLM的原理理解1-5

1、词向量

要了解语言模型的工作原理,首先需要了解它们如何表示单词。人类用字母序列来表示英文单词,比如C-A-T表示猫。语言模型使用的是一个叫做词向量的长串数字列表。例如,这是一种将猫表示为向量的方式:

[0.0074, 0.0030, -0.0105, 0.0742, 0.0765, -0.0011, 0.0265, 0.0106, 0.0191, 0.0038, -0.0468, -0.0212, 0.0091, 0.0030, -0.0563, -0.0396, -0.0998, -0.0796, …, 0.0002]

(注:完整的有300个数字)

2、词的意义取决于上下文


http://www.kler.cn/a/407425.html

相关文章:

  • 谈谈Mysql的常见基础问题
  • CSS —— 子绝父相
  • 2023年3月GESPC++一级真题解析
  • PHP实现冒泡排序
  • 第四课 Animation动画资源导入设置检查与优化
  • Flink转换算子——flatMap/map/filter/keyby/reduce综合练习
  • Spring Boot 动态数据源切换
  • apache、iis规则屏蔽拦截ClaudeBot等蜘蛛爬虫抓取网页
  • 营销的本质
  • 3、集线器、交换机、路由器、ip的关系。
  • 传奇996_36——背包图标,物品位置问题
  • Hive分区的种类 分区关联数据的三种方式
  • Pinia 实战教程:构建高效的 Vue 3 状态管理系统
  • 鸿蒙学习笔记:ArkUI概述
  • 从搭建uni-app+vue3工程开始
  • 现代密码学
  • 【Linux庖丁解牛】—软件安装vim!
  • Spring Boot 入门指南:从零开始搭建你的第一个应用
  • Python数据结构之链表
  • 【计算机网络】物理层