TransFormer--解码器：概括

TransFormer--解码器：概括

news/2024/11/17 12:58:28/文章来源:https://blog.csdn.net/weixin_44144773/article/details/143814875

TransFormer--解码器：概括

假设我们想把英语句子I am good（原句）翻译成法语句子Je vais bien（目标句）。首先，将原句I am good送入编码器，使编码器
学习原句，并计算特征值。在前文中，我们学习了编码器是如何计算原句的特征值的。然后，我们把从编码器求得的特征值送入解码器。
解码器将特征值作为输入，并生成目标句Je vais bien，如下图所示。

在这里插入图片描述

在编码器部分，我们了解到可以叠加N个编码器。同理，解码器也可以有N个叠加在一起。为简化说明，我们设定N=2。如下图所示，一个解码器的输出会被作为输入传入下一个解码器。我们还可以看到，编码器将原句的特征值（编码器的输出）作为输入传给所有解码器，而非只给第一个解码器。因此，一个解码器（第一个除外）将有两个输入：一个是来自前一个解码器的输出，另一个是编码器输出的特征
值。

在这里插入图片描述

接下来，我们学习解码器究竟是如何生成目标句的。当t=1时（t表示时间步），解码器的输入是，这表示句子的开始。解码器收到
作为输入，生成目标句中的第一个词，即Je，如下图所示。

在这里插入图片描述

当t=2时，解码器使用当前的输入和在上一步（t-2）生成的单词，预测句子中的下一个单词。在本例中，解码器将和Je（来自上一步）作为输入，并试图生成目标句中的下一个单词，如下图所示。

在这里插入图片描述

同理，你可以推断出解码器在t=3时的预测结果。此时，解码器将、Je和vais（来自上一步）作为输入，并试图生成句子中的下一个单词，如下图所示。

在这里插入图片描述

在每一步中，解码器都将上一步新生成的单词与输入的词结合起来，并预测下一个单词。因此，在最后一步（t=4），解码器将、Je、vais和bien作为输入，并试图生成句子中的下一个单词，如下图所示。

在这里插入图片描述

从上图中可以看到，一旦生成表示句子结束的标记，就意味着解码器已经完成了对目标句的生成工作。

在编码器部分，我们将输入转换为嵌入矩阵，并将位置编码添加到其中，然后将其作为输入送入编码器。同理，我们也不是将输入直接送
入解码器，而是将其转换为嵌入矩阵，为其添加位置编码，然后再送入解码器。

如下图所示，假设在时间步t=2，我们将输入转换为嵌入（我们称之为嵌入值输出，因为这里计算的是解码器在以前的步骤中生成的词的嵌入），将位置编码加入其中，然后将其送入解码器。

在这里插入图片描述

接下来，让我们深入了解解码器的工作原理。一个解码器模块及其所有的组件如下图所示。

在这里插入图片描述

从上图中可以看到，解码器内部有3个子层。

带掩码的多头注意力层
多头注意力层
前馈网络层

与编码器模块相似，解码器模块也有多头注意力层和前馈网络层，但多了带掩码的多头注意力层。现在，我们对解码器有了基本的认识。接下来，让我们先详细了解解码器的每个组成部分，然后从整体上了解它的工作原理。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/17820.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

3D Gaussian Splatting 代码层理解之Part1

3D Gaussian Splatting 代码层理解之Part1

2023 年初，来自法国蔚蓝海岸大学和德国马克斯普朗克学会的作者发表了一篇题为“用于实时现场渲染的 3D 高斯泼溅”的论文。该论文提出了实时神经渲染的重大进步，超越了NeRF等以往方法的实用性。高斯泼溅不仅减少了延迟，而且达到或超过了 NeRF 的渲染质量，在神经渲染领域掀…

阅读更多...

K8s学习笔记之了解k8s的网络模型

K8s学习笔记之了解k8s的网络模型

文章目录 docker 网络模型容器与容器之间，容器与宿主机之间如何通信容器访问外部网络外部网络访问容器 k8s 网络模型CNIpod 网络配置流程 k8s 热门网络插件介绍Flannel 来源Calico 来源Cilium 来源 k8s 网络插件的工作模式Flannel 的工作模式Calico 的工作模式BGP 和…

阅读更多...

探索高效的 Prompt 框架：RBTR 提示框架的奥秘与优势

探索高效的 Prompt 框架：RBTR 提示框架的奥秘与优势

前言在当今数字化的时代，人工智能（AI）已经成为我们生活和工作中不可或缺的一部分。而 Prompt 作为与 AI 交互的关键工具，其质量直接影响着我们获取信息的准确性和有用性。今天，我们将深入探讨一个通用的 Prompt 框架…

阅读更多...

丹摩征文活动 | 深度学习实战：UNet模型的训练与测试详解

丹摩征文活动 | 深度学习实战：UNet模型的训练与测试详解

🍑个人主页：Jupiter. 🚀 所属专栏：Linux从入门到进阶欢迎大家点赞收藏评论😊 目录 1、云实例：配置选型与启动1.1 登录注册1.2 配置 SSH 密钥对1.3 创建实例1.4 登录云实例 2、云存储：数据集上传…

阅读更多...

# 10_ Python基础到实战一飞冲天（一）--linux基础（十）

# 10_ Python基础到实战一飞冲天（一）--linux基础（十）

10_ Python基础到实战一飞冲天（一）–linux基础（十）–软链接硬链接-tar-gzip-bzip2-apt-软件源一、其他命令-04-文件软链接的演练实现 1、ubuntu 桌面文件如下图： 2、需求：文件软链接的演练（演…

阅读更多...

Python学习27天

Python学习27天

字典 dict{one:1,two:2,three:3} # 遍历1： # 先取出Key for key in dict:# 取出Key对应的valueprint(f"key:{key}---value:{dict[key]}")#遍历2，依次取出value for value in dict.values():print(value)# 遍历3：依次取出key,value …

阅读更多...

【Linux】进程的优先级

【Linux】进程的优先级

进程的优先级一.概念二.修改优先级的方法三.进程切换的大致原理：四.上下文数据的保存位置： 一.概念 cpu资源分配的先后顺序，就是指进程的优先权（priority）。优先权高的进程有优先执行权利。配置进程优先权对多任务环…

阅读更多...

ubuntu无密码用SCP复制文件到windows

ubuntu无密码用SCP复制文件到windows

默认情况下，ubuntu使用scp复制文件到windows需要输入密码: scp *.bin dev001@172.16.251.147:~/Desktop/. 为了解决每次复制文件都要输入密码这个问题，需要按如下操作: 1.创建ssh密钥 ssh-keygen -t ed25519 -C "xxx_xxx_xxx@hotmail.com" 2.使用scp复制公钥到w…

阅读更多...

单片机GPIO中断+定时器软件串口通信

单片机GPIO中断+定时器软件串口通信

单片机GPIO中断定时器软件串口通信解决思路代码示例解决思路串口波特率9600bps,每个bit约为1000000us/9600104.16us； 定时器第一次定时时间设为52us即半个bit的时间，其目的是偏移半个bit时间，之后的每104us采样并读取1bit数据。使得采样…

阅读更多...

使用Web Components构建模块化Web应用

使用Web Components构建模块化Web应用

💓 博客主页：瑕疵的CSDN主页 📝 Gitee主页：瑕疵的gitee主页 ⏩ 文章专栏：《热点资讯》使用Web Components构建模块化Web应用使用Web Components构建模块化Web应用使用Web Components构建模块化Web应用引言 Web Co…

阅读更多...

每行数据个数在变的二维数组的输出

每行数据个数在变的二维数组的输出

#include<stdio.h> int main() {//定义四个一维数组int arr1[1] { 1 };int arr2[3] { 1,2,3 };int arr3[5] { 1,2,3,4,5 };int arr4[7] { 1,2,3,4,5,6,7 };//把四个一维数组放进一个二维数组int* arr[4] { arr1,arr2,arr3,arr4};//预先计算好每一个数组真实的长度in…

阅读更多...

【SSL证书】腾讯云SSL续签备忘录

【SSL证书】腾讯云SSL续签备忘录

适用于证书过期了，需要替换证书的场景。本备忘录为nginx使用证书场景步骤：一共7步。登录腾讯云控制台->申请免费证书->腾讯云审核->下载->登录服务器->替换证书->重启nginx 1.登录控制台 https://console.cloud.tencent.com/ssl…

阅读更多...

AVL树

AVL树

一.AVL树的概念 AVL树是一颗特殊的二叉搜索树。二叉搜索树在有些极端情况下可能会出现单支的情况，这会影响其插入查找的效率。而AVL树是一个高度平衡的二叉搜索树，它要求任何的左右子树的高低差都小于等于1。它可以通过去控制左右子树的高度差来控制二叉…

阅读更多...

鸿蒙开发-网络数据访问、应用本地数据保存

鸿蒙开发-网络数据访问、应用本地数据保存

HTTP概述 HTTP，全称Hyper Text Transfer Protocol 超文本传输协议。 HTTP请求为短连接。客户端发起请求，服务器返回响应。本次连接即结束。添加网络权限在访问网络之前，需要在module.json5中给APP添加网络权限 "module": {&…

阅读更多...

画五边形思路

画五边形思路

1. 计算圆心 view 中心点 2.规定半径 R < view宽度 / 2 3.计算五边形五个顶点（角度A 2π / 5） 4. 五点相连转载： Android自定义控件芝麻信用分雷达图 - 简书

阅读更多...

网络工程实验三：DHCP的配置

网络工程实验三：DHCP的配置

#实验仅供参考，勿直接粘贴复制，用以学习交流# #对于软件的使用，请移步到实验一观看# 1、实验目的： （1）掌握DHCP工作原理。 （2）配置路由器作为DHCP服务器。 （3&#x…

阅读更多...

手写体识别Tensorflow实现

手写体识别Tensorflow实现

简介：本文先讲解了手写体识别中涉及到的知识，然后分步讲解了代码的详细思路，完成了手写体识别案例的讲解，希望能给大家带来帮助，也希望大家多多关注我。本文是基于TensorFlow1.14.0的环境下运行的手写体识别Tensorflo…

阅读更多...

【SpringBoot】公共字段自动填充

【SpringBoot】公共字段自动填充

问题引入 JavaEE开发的时候，新增字段，修改字段大都会涉及到创建时间(createTime)，更改时间(updateTime)，创建人(craeteUser)，更改人(updateUser)，如果每次都要自己去setter()，会比较麻烦&#…

阅读更多...

【项目开发】为什么文件名要小写？

【项目开发】为什么文件名要小写？

未经许可，不得转载。文章目录一、可移植性二、易读性三、易用性四、便捷性一、可移植性 Linux 系统对文件名大小写敏感，而 Windows 和 Mac 系统则不敏感。这种差异可能导致跨平台的问题。例如，以下四个文件名： computerComPutercomPuterCOMPOTer在 Linux 系统上，它们…

阅读更多...

ssm127基于SSM的乡镇篮球队管理系统+jsp(论文+源码)_kaic

ssm127基于SSM的乡镇篮球队管理系统+jsp(论文+源码)_kaic

毕业设计（论文） 题目：乡镇篮球队管理系统设计与实现摘要现代经济快节奏发展以及不断完善升级的信息化技术，让传统数据信息的管理升级为软件存储，归纳，集中处理数据信息的管理方式。本乡镇篮球队管理…

阅读更多...

最新文章