【CSP CCF记录】202305-2第30次认证 矩阵运算

题目

样例输入

3 2
1 2
3 4
5 6
10 10
-20 -20
30 30
6 5
4 3
2 1
4 0 -5

样例输出

480 240
0 0
-2200 -1100

思路

我的初步想法是按照题目所给计算顺序,分为三步计算,即:

1. tmp1=Q\times K^{T},时间复杂度为O(n^{2}\cdot d)

2. tmp2=W\cdot tmp1,时间复杂度为O(n)

3.result=tmp2\times V,时间复杂度为O(n^{2}\cdot d)

果不其然内存爆了。。。思考能否通过矩阵的运算性质改变计算顺序,降低时间复杂度。

点乘和矩阵乘法一起运算时,是否可以改变计算顺序呢?即(W\cdot (Q\times K^{T}))\times V变为W\cdot( (Q\times K^{T})\times V)。网上多半Transformer机制的含义进行解释,但是万一遇到不了解的机制怎么办,所以我还是进行了一个简陋的证明:

有了以上结论且已知矩阵乘法具有结合律,那么,我们可以把运算顺序改为 W\cdot( Q\times (K^{T}\times V)),这样三步计算分别为:

1. tmp1=K^{T}\times V,时间复杂度为O(d^{2}\cdot n)

2. tmp2=Q\times tmp1,时间复杂度为O(d^{2}\cdot n)

3.result=W\cdot tmp2,时间复杂度为O(n)

由于d比n的数据范围要小得多,很显然我们降低了时间复杂度。

还思路不清的,希望下面对样例的手算可以帮助到你,注意i,j,k变量的遍历

相关概念

矩阵乘法

矩阵点乘

代码

这里注意,由于数组较大,需将数组设置为全局变量(开在main())之外,否则会导致栈溢出。

#include<bits/stdc++.h>
using namespace std;
int Q[10010][30]={0},K[10010][30]={0},V[10010][30]={0},W[10010]={0};
int Kt[30][10010]={0};
int n,d;
long long tmp1[30][30]={0};
long long tmp2[10010][10010]={0};
long long result[10010][30]={0};
int main()
{cin>>n>>d;//输入Q for(int i=0;i<n;i++){for(int j=0;j<d;j++){cin>>Q[i][j];}}//输入K,再转置为Kt for(int i=0;i<n;i++){for(int j=0;j<d;j++){cin>>K[i][j];Kt[j][i]=K[i][j];}}//输入V for(int i=0;i<n;i++){for(int j=0;j<d;j++){cin>>V[i][j];}}//输入W for(int i=0;i<n;i++){cin>>W[i]; }//tmp1=KtxVfor(int i=0;i<d;i++) {for(int j=0;j<d;j++){for(int k=0;k<n;k++){tmp1[i][j]+=Kt[i][k]*V[k][j];}//cout<<tmp1[i][j]<<" ";}//cout<<endl;}//tmp2=Qxtmp1,result=W·tmp2 for(int i=0;i<n;i++) {for(int j=0;j<d;j++){for(int k=0;k<d;k++){tmp2[i][j]+=Q[i][k]*tmp1[k][j];}result[i][j]=tmp2[i][j]*W[i];}}for(int i=0;i<n;i++){for(int j=0;j<d;j++){cout<<result[i][j]<<" ";}cout<<endl;}return 0;
}

运行

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/34904.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Tomcat,javaweb, servlet , springBoot

在server.xml里配置服务器 <scope>provided</scope>打包的时候&#xff0c;这个jar包不会被打进去&#xff0c;因为tomcat已将封装了这个jar包&#xff0c;没必要要这个

书生实战营第四期-进阶岛第一关-探索 InternLM 模型能力边界

任务一: InternThinker 挑战 Leetcode Leetcode题目链接 Prompt InternThinker 回答截图 Q1 仅含置位位的最小整数 - 力扣&#xff08;LeetCode&#xff09; 给你一个正整数 n。 返回 大于等于 n 且二进制表示仅包含 置位 位…

[SAP ABAP] ALV基础开发

ALV全称为SAP List Viewer&#xff0c;是SAP中常用的报表输出格式&#xff0c;输出结果以行和列展示&#xff0c;集成的功能有排序&#xff0c;求和&#xff0c;过滤&#xff0c;隐藏&#xff0c;筛选等功能 ALV格式的数据是以单元格为单位显示&#xff0c;这种方式便于数据导…

360全向触觉型灵巧手 Allegro Hand V5 亮相,Wonik 机器人助推前沿科技前行

在机器人技术持续演进的当下&#xff0c;Wonik Robotics 依靠自身技术实力&#xff0c;推出了新一代机器人手 Allegro Hand V5&#xff0c;为工业与科研领域带来新机遇。 Allegro Hand V5 具备诸多出色特性。 Allegro Hand V5 指尖配备的全方位触觉传感器是一大亮点&#xff0…

python 装饰器学习与实践

目录 装饰器学习1、最基本装饰器2、函数带参数的装饰器3、装饰器带参数4、类中函数的装饰器5、装饰器实践6、pyqt5类中方法的装饰器实现时遇到的问题 装饰器学习 先假定一个场景 在之前的一篇文章中&#xff0c;分享了一个pyqt5将日志实时展示在gui界面上的功能python在pyqt5l…

12.4深度学习_模型优化和迁移_awanb、tb

一、数据获取方法 1. 开源数据集 ​ 免费&#xff0c;成本低 PyTorch&#xff1a; https://pytorch.org/vision/stable/datasets.html 开源数据集imagenet&#xff1a;https://image-net.org/ Hugging Face数据集&#xff1a;https://huggingface.co/datasets kaggle数据集…

网络基础知识

172.16.24.100这个是ip地址&#xff0c;讲师机的IP地址。IP地址&#xff08;Internet Protocol Address&#xff09;是指互联网协议地址&#xff0c;又译为网际协议地址。每台电脑只要联网都会有ip地址。ip地址数量有限&#xff0c;不够给世界上每一台电脑分配ip地址&#xff0…

漫画之家系统:Spring Boot技术下的漫画发现引擎

4 系统设计 4.1系统设计主要功能 通过市场调研及咨询研究&#xff0c;了解了用户及管理者的使用需求&#xff0c;于是制定了管理员和用户等模块。功能结构图如下所示&#xff1a; 图4-1系统功能结构图 4.2数据库设计 4.2.1数据库设计规范 数据可设计要遵循职责分离原则&#…

漫画之家系统:Spring Boot框架下的漫画版权保护

摘 要 随着信息技术和网络技术的飞速发展&#xff0c;人类已进入全新信息化时代&#xff0c;传统管理技术已无法高效&#xff0c;便捷地管理信息。为了迎合时代需求&#xff0c;优化管理效率&#xff0c;各种各样的管理系统应运而生&#xff0c;各行各业相继进入信息管理时代&a…

【python rich 超级牛终端中提供富文本和精美格式】

Rich 是一个 Python 库&#xff0c;可以为您在终端中提供富文本和精美格式。 》》》》官方代码和文档《《《《 Rich 的 API 让在终端输出颜色和样式变得很简单。此外&#xff0c;Rich 还可以绘制漂亮的表格、进度条、markdown、语法高亮的源代码以及栈回溯信息&#xff08;tr…

【电子设计】WifiESP8266无线通信

硬件 野火STM32开发板 操作系统 FreeRTOS 软件Keil5野火蓝牙模块 ESP8266模块 1. ESP8266 简介 ESP8266 是串口型 WIFI&#xff0c;速度比较低&#xff0c;不能用来传输图像或者视频这些大容量的数据&#xff0c;主要应用于数据量传输比较少的场合&#xff0c;比如温湿度…

44.5.【C语言】辨析“数组指针”和“指针数组”

目录 1.数组指针 2.指针数组 执行结果 底层分析 1.数组指针 从语文的角度理解,"数组"修饰"指针".因此数组指针是指针 例如以下代码 #include <stdio.h> int main() {char a[5] { "ABCDE" };return 0;} 其中a就是数组指针,因为数…

docker安装victoriametrics(单机版)

docker安装victoriametrics 1、单机版安装2、victoriametrics增删改查2.1 、插入数据2.1.1 组装数据插入victoriametrics(java代码插入)2.1.2 Prometheus数据插入victoriametrics2.1.3 官网push到victoriametrics写法 2.2 、查询2.2.1 、Instant query&#xff08;即时查询&…

趣讲TCP三次握手

一、TCP三次握手简介 TCP&#xff08;Transmission Control Protocol&#xff0c;传输控制协议&#xff09;是一种面向连接的、可靠的、基于字节流的传输层通信协议。在TCP连接中&#xff0c;只有两方进行通信&#xff0c;它使用校验和、确认和重传机制来保证数据的可靠传输。…

攻防世界 ctf刷题 新手区1-10

unserialize3 因为我上个笔记写了 php返序列化 所以先趁热打铁 看这个题目名字 我们就知道是 反序列化呀 因为flag有值所以 我们先输个 111 看看有没有线索 没线索但是这边 有个发现就是他是使用get方式传参的 可能他会把我们的输入 进行传入后台有可能进行反…

股指期货基差的影响因素有哪些?

在股指期货交易中&#xff0c;有一个重要的概念叫做“基差”。简单来说&#xff0c;基差就是股指期货价格与其对应的现货价格之间的差异。比如&#xff0c;我们现在有IC2401股指期货&#xff0c;它挂钩的是中证500指数。如果IC2401的价格是5244&#xff0c;而中证500指数的价格…

【单片机基础知识】MCU三种启动方式(Boot选择)[主Flash/系统存储器(BootLoader)/嵌入式SRAM]——老版

请跳转到最新版&#xff1a; 【单片机开发】MCU三种启动方式(Boot选择)[主Flash/系统存储器(BootLoader)/嵌入式SRAM]-CSDN博客 参考资料&#xff1a; MCU的三种启动方式 - EdgeAI Lab 立芯嵌入式的视频 在SRAM中运行代码 - EdgeAI Lab 利用 Boot 选择不同的启动方式&…

frp内网穿透的配置与设置

FRP&#xff08;Fast Reverse Proxy&#xff09;是一个高性能的反向代理应用&#xff0c;可以实现内网穿透功能。它帮助你将内网的服务暴露到公网&#xff0c;无需公网IP和端口映射&#xff0c;非常适合需要穿透防火墙、NAT的场景。以下是 FRP 内网穿透的配置和设置方法。 ###…

图数据库 | 13、图数据库架构设计——高性能计算架构再续

书接上文 图数据库 | 12、图数据库架构设计——高性能计算架构​​​​​​。昨天老夫就图数据库架构设计中的 实时图计算系统架构、图数据库模式与数据模型、核心引擎如何处理不同的数据类型、图计算引擎中的数据结构 这四块内容进行了展开讲解&#xff0c;今儿继续往下、往深…

一、web基础和http协议

前言 https://www.baidu.com/&#xff1a;URL&#xff08;是一种万维网寻址网址&#xff09; https://&#xff1a;协议&#xff0c;加密的http&#xff0c;加密的超文本传输协议&#xff0c;在数据传输之前要通过整数进行身份验证&#xff0c;验证通过才可以进行数据传输。 …