当前位置: 首页 > article >正文

embeding 层到底是什么

embending 的本质是 word2vec 大白话讲解word2vec到底在做些什么
那时候 博主还比较年轻 ,啃过托马斯马尔科夫的 word2vec 源码 ,那是一个三层神经网络,用C实现的 ,最近创业失败了 ,又去找工作,啥都不会,被一众 后辈嘲笑,这都快十年过去了,世上已前年的感觉,出来个什么大模型,本质也是nlp ,今天想看看 这个 大模型基础embeding ,想看看这个层到底是什么东西,直接上源码吧
import numpy as np
import torch.nn as nn
import torch

embedding=torch.nn.Embedding(4,2)
#vocab_size:表示一共有多少个字需要embedding,
#emb_size:表示我们希望一个字向量的维度是多少。


me=torch.tensor([0],dtype=torch.int64)
you=  torch.tensor([1],dtype=torch.int64)

other=torch.tensor([3],dtype=torch.int64)

print(embedding(me))
print(embedding(you))

print(embedding(other))
tensor([[-0.2216,  0.1621]], grad_fn=<EmbeddingBackward0>)
tensor([[0.6301, 1.3375]], grad_fn=<EmbeddingBackward0>)
tensor([[-0.5222, -0.3898]], grad_fn=<EmbeddingBackward0>)
embedding.weight
Parameter containing:
tensor([[-0.2216,  0.1621],
        [ 0.6301,  1.3375],
        [-1.0004,  0.4421],
        [-0.5222, -0.3898]], requires_grad=True)
embeding 层 本质获取 层的权值矩阵的某一行,比如我们这个层的权重

( − 0.2216 , 0.1621 0.6301 , 1.3375 − 1.0004 , 0.4421 − 0.5222 , − 0.3898 ) \begin{pmatrix} -0.2216,& 0.1621\\ 0.6301,& 1.3375\\ -1.0004, &0.4421\\ -0.5222, &-0.3898\\ \end{pmatrix} 0.2216,0.6301,1.0004,0.5222,0.16211.33750.44210.3898

me=torch.tensor([0],dtype=torch.int64) 
print(embedding(me))

就是取第一行

tensor([[-0.2216,  0.1621]], grad_fn=<EmbeddingBackward0>)

http://www.kler.cn/a/451238.html

相关文章:

  • WebRTC搭建与应用(五)-Coturn踩坑记
  • RGCL:A Review-aware Graph Contrastive Learning Framework for Recommendation
  • Windows内核开发环境配置
  • mysql数据库面试核心概念
  • 漏洞检测工具:HOST头部攻击
  • 本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——13使用Resnet-Bin
  • YOLOv8 引入高效的可变形卷积网络 DCNv4 | 重新思考用于视觉应用的动态和稀疏算子
  • 【hackmyvm】BlackWidow靶机wp
  • MongoDB教程002:文档(表)的增删改查
  • 如何在防火墙上指定ip访问服务器上任何端口呢
  • websocket再项目中的使用
  • java提高正则处理效率
  • Unity3D 控制Spine刷新率详解
  • Linux xargs 命令使用教程
  • nginx—rewrite功能
  • SQL中的约束
  • 数据库管理系统——NoSQL之文档数据库(MongoDB)
  • WEB UI 创建视图
  • 单片机:实现定时器中断(数码管读秒+LED闪烁)(附带源码)
  • 顶顶通呼叫中心中间件mod_cti模块安全增强,预防盗打风险(mod_cti基于FreeSWITCH)
  • CSS系列(26)-- 动画性能优化详解
  • SDK 指南
  • 【每日学点鸿蒙知识】启动耗时分析、IDE报错、emitter内存泄漏、radio C API、SDK下载失败
  • IDEA2024如何清理缓存和重启【最新教程】
  • vue+openlayers直接前端加载tif文件,不需要geoserver发布
  • Flutter 开关属性