自注意力机制

自注意力机制

news/2024/11/14 11:58:16/文章来源:https://blog.csdn.net/weixin_43899239/article/details/143638826

当输入一系列向量，想要考虑其中一个向量与其他向量之间的关系，决定这个向量最后的输出

任意两个向量之间的关系计算

计算其他向量对a1的关联性

多头注意力机制

图像也可以看成一系列的向量，交给自注意力机制处理，CNN是特殊的自注意力机制。

RNN跟自注意力机制也有关。

seq2seq model

multi-class classification 从多个类中选择一个类

multi-lable classification 一个物体可能属于多个类

FC：fully connect

transformer encoder 架构

最初的编码模型：

变形：

解码：需要自己决定输出的长度

解码器会将自己在前一个阶段的输出当作输入。

编码器和解码器之间的差距：

masked的区别在于，对于目标向量，只考虑其左边的，因为解码器是一个一个输出的，在没有前面数据的时候，后边数据不可能出现。

自回归编码和非自回归编码（AT/NAT）

编码器和解码器之间的连接：

训练的时候：teacher forcing:用真实数据作为输入，为了防止解码器在测试阶段，容错率低，可以在真实数据中加入一点错误。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/9610.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

RabbitMQ的死信队列

RabbitMQ的死信队列

1.死信的概念死信简单理解就是因为种种原因，无法被消费的消息. 有死信自然就有死信队列，消息再一个队列中编程死信之后，它能被重新发送到另一个交换器中，这个交换器就是DLX，绑定DLX的队列，就被称为死信队…

阅读更多...

十六 MyBatis使用PageHelper

十六 MyBatis使用PageHelper

十六、MyBatis使用PageHelper 16.1 limit分页 mysql的limit后面两个数字： 第一个数字：startIndex（起始下标。下标从0开始。）第二个数字：pageSize（每页显示的记录条数） 假设已知页码pageNum&…

阅读更多...

SpringBoot框架在共享汽车管理中的应用

SpringBoot框架在共享汽车管理中的应用

3系统分析 3.1可行性分析通过对本共享汽车管理系统实行的目的初步调查和分析，提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性本共享汽车管理系统采用SSM框架，JAVA作为开发语…

阅读更多...

数字化转型助手快鲸SCRM系统为企业营销赋能

数字化转型助手快鲸SCRM系统为企业营销赋能

内容概要在当今这个快速变化的商业环境中，数字化转型已经成为企业生存与发展的关键要素。无论是零售、制造还是服务行业，企业都深刻意识到传统工作模式的局限性，必须借助先进的技术来优化运营和提升客户体验。快鲸SCRM系统就是这样一款数字…

阅读更多...

ZooKeeper在kafka集群中有何作用

ZooKeeper在kafka集群中有何作用

Zookeeper 存储的 Kafka 信息 （1）启动 Zookeeper 客户端。 bin/zkCli.sh （2）通过 ls 命令可以查看 kafka 相关信息。 [zk: localhost:2181(CONNECTED) 2] ls /kafkazk中有一个节点 consumers 这个里面，老版本0.9版…

阅读更多...

Linux操作系统:学习进程_对进程概念的深入了解

Linux操作系统:学习进程_对进程概念的深入了解

目录前言开篇一、进程概念二、进程的描述与管理 1、如何描述与管理 2、Linux中的PCB-task_struct 3、对进程组织的理解三、进程的属性 1、系统创建进程 2、查看进程 3、进程的标识符 4、退出进程 1>ctrlc 2>kill命令杀死进程 5、用户进程的创建方式…

阅读更多...

Embedding 技术在推荐系统中的应用

Embedding 技术在推荐系统中的应用

参考自《深度学习推荐系统》——王喆，用于学习和记录。介绍 Embedding，中文直译为“嵌入”，常被翻译为“向量化”或者“向量映射”。它的主要作用是将稀疏向量转换成稠密向量，便于上层深度神经网络处理。事实上，Emb…

阅读更多...

Kafka面试题

Kafka面试题

1、kafka消息发送的流程？ 在消息发送时涉及到了两个线程，main 线程和 sender 线程 ，在main线程里面创建了一个双端队列（RecordAccumulator） ,当双端队列里面的信息满足一定的条件后， sender线程会拉取双端…

阅读更多...

RabbitMQ延迟队列（重要）

RabbitMQ延迟队列（重要）

RabbitMQ延迟队列 1、延迟队列1.1、延迟队列使用场景1.2、延迟队列实现原理 2、使用rabbitmq-delayed-message-exchange 延迟插件2.1、下载2.2、安装2.2.1、解压2.2.2、启用插件2.2.3、查询安装情况 2.4、示例2.4.1、RabbitConfig配置类（关键代码）2.4.2、…

阅读更多...

机器学习—神经网络如何高效实现

机器学习—神经网络如何高效实现

深度学习研究人员能够扩展神经网络的原因之一，在过去的十年里建立了非常大的神经网络，是因为神经网络可以向量化，它们可以使用矩阵乘法非常有效的实现，事实证明，并行计算硬件，包括gpus，但也有一…

阅读更多...

【数据集】【YOLO】【目标检测】水面船只识别数据集 9798 张，YOLO船只识别算法实战训练教程！

【数据集】【YOLO】【目标检测】水面船只识别数据集 9798 张，YOLO船只识别算法实战训练教程！

一、数据集介绍【数据集】水面船只识别数据集 9798 张，目标检测，包含YOLO/VOC格式标注。数据集中包含1种分类：{0: ship}，代表水面船只。数据集来自国内外图片网站和视频截图； 可用于无人机船只检测、监控灯塔船…

阅读更多...

斜坡函数功能块(支持正常停机和紧急停机切换)

1、CODESYS斜坡函数功能块 CODESYS斜坡函数功能块(ST源代码)_用plc难能写一个斜坡加减速度吗-CSDN博客文章浏览阅读1k次。本文介绍了如何在CODESYS平台上创建斜坡函数功能块（FC），用于PID闭环控制中的给定值平滑处理。通过ST源代码实现，详细步骤包括仿真测试、变量修改、FC…

阅读更多...

渗透测试--web基础之windows（二）：常用命令详解及病毒编写

渗透测试--web基础之windows（二）：常用命令详解及病毒编写

声明：学习素材来自b站up【泷羽Sec】，侵删，若阅读过程中有相关方面的不足，还请指正，本文只做相关技术分享,切莫从事违法等相关行为，本人一律不承担一切后果目录一、常见端口对应的服务二、常见的cmd命…

阅读更多...

【含文档】基于ssm+jsp的客户管理系统（含源码+数据库+lw）

【含文档】基于ssm+jsp的客户管理系统（含源码+数据库+lw）

1.开发环境开发系统:Windows10/11 架构模式:MVC/前后端分离 JDK版本: Java JDK1.8 开发工具:IDEA 数据库版本: mysql5.7或8.0 数据库可视化工具: navicat 服务器: apache tomcat 主要技术: Java,Spring,SpringMvc,mybatis,mysql,vue 2.视频演示地址 3.功能管理员登录进入…

阅读更多...

腾讯混元宣布大语言模型和3D模型正式开源

腾讯混元宣布大语言模型和3D模型正式开源

腾讯混元大模型正在加快开源步伐。 11月5日，腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源，支持企业及开发者精调、部署等不同场景的使用需求，可在HuggingFace、Github等技术社区直接下载&#xff…

阅读更多...

《常用深度学习神经网络及其原理与应用场景》

《常用深度学习神经网络及其原理与应用场景》

一、总体介绍一、引言随着科技的不断发展，深度学习已经成为人工智能领域中最具影响力的技术之一。深度学习神经网络通过模拟人类大脑的神经元结构和工作方式，能够自动学习数据中的特征和模式，从而实现各种复杂的任务，如图像识…

阅读更多...

操作系统三级调度相关习题

操作系统三级调度相关习题

填空题微机是以(总线)为组带构成的计算机系统在批处理兼分时系统中，往往把由分时系统控制的作业称为(前台)作业，把由批处理系统处理的作业称为(后台)作业在分时系统中，若时间片长度一定，则(用户数越多)，系统响应时间…

阅读更多...

STL 迭代器iteratior 详解

STL 迭代器iteratior 详解

C的标准模板库（STL）中，迭代器是一种重要的工具，用于访问容器中的元素。迭代器是一个变量，相当于容器和操纵容器的算法之间的中介。迭代器可以指向容器中的某个元素，通过迭代器就可以读写它指向的元素。从…

阅读更多...

移门缓冲支架有什么作用？

移门缓冲支架有什么作用？

移门缓冲支架是一种安装在滑动门上的装置，主要用于吸收门关闭时的冲击力，防止门突然停止时的震动，从而保护门体、轨道和墙体。移门缓冲支架不仅提升了门的使用体验，还增加了安全，延长了门的使用寿命。关于移门缓冲支架…

阅读更多...

MATLAB大数计算工具箱及其用法

MATLAB大数计算工具箱及其用法

1. MATLAB大数工具箱Variable Precision Integer Arithmetic介绍 Variable Precision Integer Arithmetic是John DErrico 开发的大数运算工具箱，可以用完全任意大小的整数进行算术运算。支持vpi定义的数组和向量。 2.MATLAB代码完整代码见: https://download.cs…

阅读更多...

最新文章