torch.nn系列函数学习 --- Conv2d函数

该函数的官方文档:

https://pytorch.org/docs/stable/generated/torch.nn.Conv2d.html#torch.nn.Conv2d 

torch.nn.Conv2d(in_channelsout_channelskernel_sizestride=1padding=0dilation=1groups=1bias=Truepadding_mode='zeros'device=Nonedtype=None)

参数

以下是参数释义:

  • in_channels (int) – 输入图像的通道数
  • out_channels (int) – 卷积生成的输出通道数
  • kernel_size (int 或 tuple) – 卷积核的大小
  • stride (int 或 tuple, 可选) – 卷积的步幅。默认值:1
  • padding (int, tuple 或 str, 可选) – 在输入的四周添加的填充。默认值:0
  • padding_mode (str, 可选) – 填充模式,可以为 'zeros'(零填充)、'reflect'(反射填充)、'replicate'(复制填充)或 'circular'(循环填充)。默认值:'zeros'
  • dilation (int 或 tuple, 可选) – 卷积核元素之间的间隔。默认值:1
  • groups (int, 可选) – 从输入通道到输出通道的分组连接数。默认值:1
  • bias (bool, 可选) – 如果为 True,则为输出添加可学习的偏差项。默认值:True

注意:

  • stride 控制卷积操作的步幅,可以是一个单一的数字或一个元组。

  • padding 控制输入的填充量。可以是字符串 {‘valid’, ‘same’},或者是一个整数 / 整数组成的元组,表示在两侧应用的隐式填充量。

  • dilation 控制卷积核点之间的间距,也称为 à trous 算法。这个概念较难描述,不过此https://github.com/vdumoulin/conv_arithmetic/blob/master/gif/dilation.gif中有一个关于 dilation 的可视化展示。

  • groups 控制输入与输出之间的连接。in_channelsout_channels 都必须能被 groups 整除。例如:

    • groups=1 时,所有的输入都会与所有输出进行卷积。
    • groups=2 时,操作等价于有两个并行的卷积层,每个卷积层分别处理一半的输入通道,生成一半的输出通道,然后将结果拼接起来。
    • groups=in_channels 时,每个输入通道都有自己的一组卷积核(大小为 out_channels / in_channels)。
    • groups == in_channelsout_channels == K * in_channels,其中 K 是一个正整数时,这种操作也被称为“深度卷积(depthwise convolution)”。

参数 kernel_size, stride, padding, dilation 可以是:

  • 单个整数 —— 在这种情况下,高度和宽度维度使用相同的值。
  • 两个整数组成的元组 —— 在这种情况下,第一个整数用于高度维度,第二个整数用于宽度维度。

Conv2d 输入输出关系/输出尺寸计算公式:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/148015.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL—多表操作详解

在 MySQL 中,多表操作通常涉及联接(JOIN)和子查询(Subquery),用于处理来自多个表的数据。 约束分类 约束介绍 约束:用于对数据库表中的数据进行限定,确保数据的正确性、有效性和完…

Shelly实测天工的音乐创作功能,写了一首歌,来听听效果

​ 大家好,我是Shelly,一个专注于输出AI工具和科技前沿内容的AI应用教练,体验过300款以上的AI应用工具。关注科技及大模型领域对社会的影响10年。关注我一起驾驭AI工具,拥抱AI时代的到来。 在数字时代的洪流中,我始终…

C语言 fwirte 函数 - C语言零基础入门教程

目录 一.fwirte 函数简介二.fwirte 函数使用三.猜你喜欢 零基础 C/C 学习路线推荐 : C/C 学习目录 >> C 语言基础入门 一.fwirte 函数简介 C 语言文件读写,fread 函数用于读取文件中的数据到指定缓冲区中,而 fwrite 函数用于把缓冲区数据写入到文件…

Linux(麒麟系统)多显示器屏幕录制

Linux桌面设备在接入多显示器的情况下,有些只录主显示器,有些场景要单独录制每个显示器,X Window System支持多显示器配置和显示器列表获取,需要XRandR 1.5及以上版本,查看RandR version 命令: xrandr --version 使用x…

MCU和YT9218交换机通过RMII连接

1、可以通过带RMII的MCU和EXT1端口连接,将MCU配置为RMII 100M/全双工就可以通 2、原先在这里改SW配置, 一直不通 3、后来通过api调用可以通 这样改: 在初始化后,添加下面代码 //使能RMII,phy模式 #define Port5 …

pycharm安装教程,超详细

引言 PyCharm官网提供了两个版本,第一个版本是Professional(专业版本),这个版本功能更加强大,主要是为Python和web开发者而准备,是需要付费的。第二个版本是社区版(Community)&…

10月23-27日六西格玛绿带公开课即将在雄安新区开课

在金秋送爽、硕果累累的季节里,天行健管理咨询公司宣布了一项重要决定——定于10月23日至27日,在充满未来气息的河北雄安新区,举办一场旨在提升企业质量管理水平、培养精英人才的六西格玛绿带公开课。此次课程的举办,不仅是对当前…

LeetCode 每日一题 ---- 【1014. 最佳观光组合】

LeetCode 每日一题 ---- 【1014. 最佳观光组合】 1014.最佳观光组合题解:枚举右 维护左 1014.最佳观光组合 题解:枚举右 维护左 先对题目中的式子进行变形 values[i] values[j] i - j > (values[i] i) (values[j] - j) 枚举右端点 j&#xf…

活动报名| 探索存内计算的未来,共话AGI时代

活动日期:2024年09月28日 下午一点到6点 地点:杭州技术转移中心 三楼路演厅 议程亮点: 存内计算技术架构以及最新趋势AGI开源项目交流存内计算实操上板体验 存内计算 ——突破物理极限的下一代算力技术 直接消除“存”“算”界限&…

2024/9/22周报

文章目录 摘要Abstract可能的数据结构数据集结构 数据处理步骤数据集示例人工智能模型应用关键评估目标评价指标分类应用实例最终目标多目标优化的基本概念1. Pareto最优解(Pareto Optimality)2. 目标权重法(Weighted Sum Method)…

二.python基础语法

目录 1.第一个python实例 2.python编码规范 2.1.编写规则 2.2.命名规范 2.3. 空格 2.4. 缩进 2.5. 注释 3.python关键字和标识符 3.1.标识符 3.2.关键字 4.python变量 4.1. 定义变量 4.2. 变量类型是可变的 4.3. 多个变量指向同一个值 5.python基本数据类型 5.…

基于vue框架的传统文化传播网站设计与实现f7r43(程序+源码+数据库+调试部署+开发环境)系统界面在最后面。

系统程序文件列表 项目功能:用户,文化类型,传统文化 开题报告内容 基于Vue框架的传统文化传播网站设计与实现开题报告 一、研究背景 在全球化加速的今天,各国文化相互交融,但也面临着传统文化被边缘化的风险。中国拥有五千年文明史&#…

ai绘画工具Playground v3:重新定义AI图像生成

Playground AI是一款免费的在线AI绘画工具,它使用深度学习技术帮助用户将文字和图片转换成高质量的图像,非常适合创作艺术作品、社交媒体内容、演示文稿、海报、视频和logo等。这个工具不仅支持文生图和图生图,还提供图像编辑功能&#xff0c…

2024年找工作怎么这么难?网工该何去何从?

2024年,找工作对很多人来说都变得更加艰难,网络工程师也不例外,仿佛是寒冬一般。 招聘岗位数量骤减,求职竞争加剧,很多人在职场上感受到前所未有的压力。 你可能觉得这是行业的末日,但实际上,这…

论文集搜索网站-dblp 详细使用方法

分享在dblp论文集中的两种论文搜索方式:关键字搜索,指定会议/期刊搜索。 关键字搜索 进入dblp官方网址dblp: computer science bibliography,直接在上方搜索栏,搜索关键字,底下会列出相关论文。 指定会议/期刊搜索 …

postgres导入sql文件的方法

首先,要打开CMD,cd到postgreSQL的bin路径 在下面这个例子里,player是数据库名称,postgres是用户名 添加完成之后,打开客户端 可以看到所有表已经全部导入

基于ssm框架的博客系统

基于ssm框架的博客系统的开发 ssm640基于ssm框架的博客系统的开发vue 目 录 目 录 I 摘 要 III ABSTRACT IV 1 绪论 1 1.1 课题背景 1 1.2 研究现状 1 1.3 研究内容 2 2 系统开发环境 3 2.1 vue技术 3 2.2 JAVA技术 3 2.3 MYSQL数据库 3 2.4 B/S结构 4 2.5 SSM框…

如何着手创建企业数据目录?(四)数据质量与标准化

前文导读: 《如何着手创建企业数据目录?(一)数据目录的设定》 《如何着手创建企业数据目录?(二)数据的命名与维护》 《如何着手创建企业数据目录?(三)权限管理…

顶会创新点速递!强化学习+注意力机制,发文香饽饽!

强化学习结合注意力机制的研究在学术界和工业界都引起了广泛关注,因为它能显著提升模型处理复杂任务的效率和准确性,迅速成为了各大顶会的投稿热门。目前,强化学习注意力机制主要有三大研究方向:状态表示、动作选择、奖励预测。 …

2012-2019全球地表平均夜光年度数据

数据详情 2012-2019全球地表平均夜光年度数据 数据属性 数据名称:全球地表平均夜光年度数据 数据时间:2012-2019 空间位置:全球 数据格式:tif 空间分辨率:1500米 时间分辨率:年 坐标系:…