当前位置: 首页 > article >正文

CSP-矩阵运算

题目背景
Softmax(Q×KTd)×V 是 Transformer 中注意力模块的核心算式,其中 Q、K 和 V 均是 n 行 d 列的矩阵,KT 表示矩阵 K 的转置,× 表示矩阵乘法。

问题描述
为了方便计算,顿顿同学将 Softmax 简化为了点乘一个大小为 n 的一维向量 W:
(W⋅(Q×KT))×V
点乘即对应位相乘,记 W(i) 为向量 W 的第 i 个元素,即将 (Q×KT) 第 i 行中的每个元素都与 W(i) 相乘。

现给出矩阵 Q、K 和 V 和向量 W,试计算顿顿按简化的算式计算的结果。

输入格式
从标准输入读入数据。

输入的第一行包含空格分隔的两个正整数 n 和 d,表示矩阵的大小。

接下来依次输入矩阵 Q、K 和 V。每个矩阵输入 n 行,每行包含空格分隔的 d 个整数,其中第 i 行的第 j 个数对应矩阵的第 i 行、第 j 列。

最后一行输入 n 个整数,表示向量 W。

输出格式
输出到标准输出中。

输出共 n 行,每行包含空格分隔的 d 个整数,表示计算的结果。

样例输入
3 2
1 2
3 4
5 6
10 10
-20 -20
30 30
6 5
4 3
2 1
4 0 -5

样例输出
480 240
0 0
-2200 -1100

子任务
70 的测试数据满足:n≤100 且 d≤10;输入矩阵、向量中的元素均为整数,且绝对值均不超过 30。

全部的测试数据满足:n≤104 且 d≤20;输入矩阵、向量中的元素均为整数,且绝对值均不超过 1000。

提示
请谨慎评估矩阵乘法运算后的数值范围,并使用适当数据类型存储矩阵中的整数。

注意矩阵乘法行和列的选择,注意转置矩阵的坐标表示
代码:

#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
int main() {
    int hang,lie;
    cin>>hang>>lie;
    LL tem[lie][lie];
    LL ans[hang][lie];
    for (int i = 0; i < lie; i++) {
        for (int j = 0; j < lie; j++) {
            tem[i][j]=0;
        }
    }
    for (int i = 0; i < hang; i++) {
        for (int j = 0; j < lie; j++) {
            ans[i][j]=0;
        }
    }
    int Q[hang][lie],K[hang][lie],V[hang][lie],W[hang];
    for (int i = 0; i < hang; i++) {
        for (int j = 0; j < lie; j++) {
            cin>>Q[i][j];
        }
    }
    for (int i = 0; i < hang; i++) {
        for (int j = 0; j < lie; j++) {
            cin>>K[i][j];
        }
    }
    for (int i = 0; i < hang; i++) {
        for (int j = 0; j < lie; j++) {
            cin>>V[i][j];
        }
    }
    for (int i = 0; i < hang; i++) {
        cin>>W[i];
    }
    for (int i = 0; i < lie; i++) {
        for (int j = 0; j < lie; j++) {
            for (int k = 0; k < hang; k++) {
                tem[i][j]+=(K[k][i])*(V[k][j]);
            }
        }
    }
    for (int i = 0; i < hang; i++) {
        for (int j = 0; j < lie; j++) {
            for (int k = 0; k < lie; k++) {
                ans[i][j]+=tem[k][j]*Q[i][k];
            }
            ans[i][j]*=W[i];
        }
    }
    for (int i = 0; i < hang; i++) {
        for (int j = 0; j < lie; j++) {
            cout<<ans[i][j]<<" ";
        }
        cout<<endl;
    }
}


http://www.kler.cn/a/159591.html

相关文章:

  • Asp .Net Core 实现微服务:集成 Ocelot+Nacos+Swagger+Cors实现网关、服务注册、服务发现
  • 使用 C++ 实现神经网络:从基础到高级优化
  • AIGC视频生成模型:Meta的Emu Video模型
  • 运动相机拍视频过程中摔了,导致录视频打不开怎么办
  • 使用傅里叶变换进行图像边缘检测
  • 4 AXI USER IP
  • Elasticsearch:什么是向量嵌入?
  • 【Scopus检索】第六届生物技术与生物医学国际学术会议(ICBB 2024)
  • 使用docker搭建『Gitea』私有仓库
  • Objaverse:大规模3D模型开放数据集
  • git基础
  • unsafe类和varhandle类讲解
  • 查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
  • 1 NLP分类之:FastText
  • 同旺科技 USB TO RS-485 定制款适配器--- 拆解(二)
  • 如何基于OpenCV和Sklearn库开展数据降维
  • 力扣11.盛最多水的容器
  • lxml 总结
  • CLion安装与配置教程
  • 从无人驾驶汽车到虚拟助手:人工智能如何改变我们的世界
  • 亿胜盈科 HT4182,HT4186,HT4188 电量均衡 同步升压型 双节理电池充电器
  • 机器人制作开源方案 | 自主型收集餐盘机器人
  • 请按长度为8拆分字符串
  • Qt之QGraphicsView —— 笔记1:绘制简单图元(附完整源码)
  • 美图发布自研视觉大模型4.0,主打AI设计与AI视频【无际Ai分享资讯】
  • 养生茶饮行业分析:2023年中国市场消费需求