当前位置: 首页 > article >正文

动手学深度学习64 注意力机制

1. 注意力机制

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
非参: 没有参数。
给定数据:key value对
x:query。
来了一个新数据,只看和新数据比较相近的某些数据的y。类似于K近邻
K: kernel 核, 函数,计算新来的数据和已有的数据的距离。

K怎么选?
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. 代码

w: 设置平滑一点或者不平滑一些。 让窗口变窄?

import torch
from d2l import torch as d2l
def show_heatmaps(matrices, xlabel, ylabel, titles=None, figsize=(2.5, 2.5),
                  cmap='Reds'):
    """显示矩阵热图"""
    d2l.use_svg_display()
    num_rows, num_cols = matrices.shape[0], matrices.shape[1]
    fig, axes = d2l.plt.subplots(num_rows, num_cols, figsize=figsize,
                                 sharex=True, sharey=True, squeeze=False)
    for i, (row_axes, row_matrices) in enumerate(zip(axes, matrices)):
        for j, (ax, matrix) in enumerate(zip(row_axes, row_matrices)):
            pcm = ax.imshow(matrix.detach().numpy(), cmap=cmap)
            if i == num_rows - 1:
                ax.set_xlabel(xlabel)
            if j == 0:
                ax.set_ylabel(ylabel)
            if titles:
                ax.set_title(titles[j])
    fig.colorbar(pcm, ax=axes, shrink=0.6);
    
attention_weights = torch.eye(10).reshape((1, 1, 10, 10))
show_heatmaps(attention_weights, xlabel='Keys', ylabel='Queries')

http://www.kler.cn/a/373098.html

相关文章:

  • 基于SSM学生竞赛模拟系统的设计
  • Linux——五种IO模型
  • python通过keyboard库实现模拟/监听键盘
  • 电子电气架构 --- 车载芯片现状
  • 双11猫咪好物盛典开启,线上抢购不停 购物清单新鲜出炉
  • 使用和删除数据库
  • 线性数据结构之数组
  • 基于 GADF+Swin-CNN-GAM 的高创新扰动信号识别模型!
  • 在深度学习研究方向有哪些创新点
  • AI驱动的图像文本提取【Llama 3.2-Vision】
  • CSS实现回到顶部且平滑过渡
  • Zoho x Zendure:借助Zoho One加速从0到1出海品牌搭建
  • 【速查笔记】单片机
  • 让卷积神经网络来辨识马和人
  • 【折腾一上午】Java POI 导出 Excel 自适应列宽行高
  • STM32FreeRTOS 使用QSPI驱动nandFlash
  • Sentinel底层如何计算京东双十一线上系统实时QPS
  • 【SAP FICO】八大业务_6货币资金管理
  • 挑战Java面试题复习第3天,无人扶我青云志
  • ELK Stack与Graylog:强大的日志分析和可视化工具
  • 分类算法——LightGBM 详解
  • 基于SSM+微信小程序的汽车维修管理系统(汽车5)
  • 使用Python批量合并多个PDF文档
  • 使用 Flask 实现简单的登录注册功能
  • Unity计算二维向量夹角余弦值和正弦值的优化方法参考
  • cmake学习笔记