YOLOv9改进 | 特征融合篇,YOLOv9添加iAFF(多尺度通道注意力模块),二次创新RepNCSPELAN4结构,提升小目标检测能力


在这里插入图片描述

摘要

特征融合,即来自不同层或分支的特征的组合,是现代网络架构中无处不在的一部分。虽然它通常通过简单的操作(如求和或拼接)来实现,但这种方式可能并不是最佳选择。在这项工作中,提出了一种统一且通用的方案,即注意力特征融合(Attentional Feature Fusion),适用于大多数常见场景,包括短跳跃连接和长跳跃连接引起的特征融合以及 Inception 层内的特征融合。传统注意力机制往往忽略了不同尺度的特征问题,尤其是当融合特征来自不同尺度的层时。为了更好地融合语义和尺度不一致的特征,提出了一个多尺度通道注意力模块(Multi-Scale Channel Attention Module),通过对通道的多尺度上下文信息进行聚合,能够同时强调全局分布较大的对象以及局部分布较小的对象。通过这种方式,网络能够更好地识别和检测尺度变化较大的对象。总而言之,该模块解决了在不同尺度上给出的特征融合时出现的问题,特征图的初始整合可能成为瓶颈,并且通过增加另一个层次的注意力(称之为迭代注意力特征融合)可以缓解这一问题。iAFF在特征融合方面具有很大的潜力,可以持续产生更好的结果。

理论介绍

AFF和iAFF的示意图如下:

在这里插入图片描述

AFF模块: 通过关注通道的不同尺度(即多尺度通道注意力),解决不同层次特征融合的语义和尺度不一致问题。图(a)中两个输入特征图(X 和 Y)的信息,经过多尺度通道注意力模块(MS-CAM)后,输出特征图Z。具体流程如下:

  • 输入特征 X 和 Y:分别表示不同层或不同尺度的特征图。它们的尺寸都是 C×H×W (C 是通道数,H 和 W 是特征图的高度和宽度)。
  • 加权乘法:首先对 X 和 Y
    进行通道上的加权操作,用不同的权重去强调某些通道的信息。通过加权乘法后,两个特征会分别与权重矩阵进行逐通道的乘法操作。
  • MS-CAM:经过通道加权后的 X 和 Y
    被送入多尺度通道注意力模块(MS-CAM)。这个模块负责捕捉不同尺度的全局和局部信息,确保不同分辨率下的特征都能得到充分的融合。
  • 加法操作:最后,将来自 X 和 Y 的特征经过加权求和后得到输出特征 Z。

iAFF模块 :在AFF模块基础上进一步引入另一层注意力,改善特征融合质量。 这些模块通过更有效的特征融合方式提升了网络整体性能。流程:

  • 第一次加权和融合:与 AFF 一致,首先对输入特征 X 和 Y 进行加权乘法和融合操作,得到初步的输出特征。
  • <

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1544705.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

C++ std::any升级为SafeAny

std::any测试 #include <any>class A { public:int8_t a; };int main(int argc, char* argv[]) {std::any num((int8_t)42);auto a std::any_cast<A>(num);return 0; }异常&#xff1a; 0x00007FFA9385CD29 处(位于 test.exe 中)有未经处理的异常: Microsoft C 异…

网络威慑战略带来的影响

文章目录 前言一、网络威慑的出现1、人工智能带来的机遇二、网络空间的威慑困境1、威慑概念的提出2、网络威慑的限度3、人类对网络威胁的认知变化4、网络空间的脆弱性总结前言 网络威慑是国家为应对网络空间风险和威胁而采取的战略。冷战时期核威慑路径难以有效复制至网络空间…

AI大模型行业应用:企业如何走出一条智能化蜕变之路?

随着chatGPT的横空问世&#xff0c;我们对于人工智能在日常生活中的应用场景逐渐了解&#xff0c;无论是搜索、问答、文生图还是文生视频都出现了很多创意&#xff0c;甚至AI还可以做诗&#xff0c;输入一条指令&#xff0c;就可以让它当场赋诗一首。人工智能的发展&#xff0c…

五种方式帮你提升独立站销售额

想要提升独立站利润&#xff0c;一种方式就是降低你的单个购买用户成本&#xff0c;购买用户一方面是来源于广告引流&#xff0c;另一方面是自然流量和老用户复购&#xff0c;但许多新的独立站后者来源都是非常少的&#xff0c;比较依赖广告引流&#xff0c;当我们广告的单个用…

Splunk、Snort在入侵检测中的应用

前期准备 splunk环境验证 splunk相关命令 查看服务端采集了哪些客户端的日志&#xff1a; ./bin/splunk list deploy-clients Deployment client: CF787A85-1BF8-4460-9FA9-469FEEB95BCD applications: {_server_app_39.30: {action: Install, archive: /home/splunk/var/ru…

ChatGPT 诞生663天后,奥特曼罕见发表预言长文力推超级智能:时间不多了,还有不会使用chatgpt4请看文章开头?

还不知道怎么订阅chatgpt4.0和最新的大模型&#xff0c;可以看这里 &#xff1a;WildCard官方平台订阅chatgpt 今天&#xff0c;OpenAI 公司 CEO 山姆奥特曼在一篇题为《智能时代》的最新个人博文中&#xff0c;概述了自己对于 AI 驱动的技术进步与全球繁荣未来的愿景。这篇文…

用Swift实现验证回文字符串

如果在将所有大写字符转换为小写字符、并移除所有非字母数字字符之后&#xff0c;短语正着读和反着读都一样。则可以认为该短语是一个 回文串 。 字母和数字都属于字母数字字符。 给你一个字符串 s&#xff0c;如果它是 回文串 &#xff0c;返回 true &#xff1b;否则&#…

深度学习500问——Chapter14:超参数调整(3)

文章目录 14.5 如何改善GAN的性能 14.6 AutoML 14.6.1 什么是AutoML 14.6.2 自动化超参数搜索方法有哪些 14.6.3 什么是神经网络架构搜索&#xff08;NAS&#xff09; 14.6.4 NASNet的设计策略 14.6.5 网络设计中&#xff0c;为什么卷积核设计尺寸都是奇数 14.6.6 网络设计中&a…

一文详解GB28181、RTSP、RTMP

GB28181 GB28181 即 GB/T28181—2016《公共安全视频监控联网系统信息传输、交换、控制技术要求》。它是公安部提出的公共安全行业标准&#xff0c;在视频监控领域具有重要地位。 主要目的和应用场景&#xff1a; 目的&#xff1a;解决不同厂家的视频监控设备执行各自标准&…

相交链表 -------------应用

给你两个单链表的头节点 headA 和 headB &#xff0c;请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点&#xff0c;返回 null 。 图示两个链表在节点 c1 开始相交&#xff1a; 题目数据 保证 整个链式结构中不存在环。 注意&#xff0c;函数返回结果后&…

【机器学习(十)】时间序列预测月销量案例分析—Holt-Winters算法—Sentosa_DSML社区版

文章目录 一、Holt-Winters算法原理(一) 加法模型(二) 乘法模型(三) 阻尼趋势 二、Holt Winters算法优缺点优点缺点 三、Python代码和Sentosa_DSML社区版算法实现对比(一) 数据读入和统计分析(二) 数据预处理(三) 模型训练和模型评估(四) 模型可视化 四、总结 一、Holt-Winters…

论文研读——《Task-Adaptive Negative Envision for Few-Shot Open-Set Recognition》

这是一篇关于少样本开集识别的论文。 目录 论文简介&#xff1a; 名词补充 论文的贡献 负原型生成器 确定动态阈值 共轭训练 补充&#xff1a;元训练过程 共轭训练过程 共轭训练损失 实验设置 总结 论文简介&#xff1a; Task-Adaptive Negative Envision for Few-…

怎么把照片转换成jpg格式?这5种转换方法简单高效

照片是我们记录生活、分享美好的重要方式。然而&#xff0c;不同设备和软件生成的照片格式各异&#xff0c;有时为了兼容性或文件大小的需求&#xff0c;我们需要将照片转换成JPG格式。很多小伙伴不知道怎么转换&#xff0c;下面来给大家分享5种简单高效的转换方法&#xff0c;…

tokenizer简述

知乎&#xff1a;难赋链接&#xff1a;https://zhuanlan.zhihu.com/p/721054525 简述 为了方便计算机处理文本&#xff0c;我们常把文本转化为数值的形式。具体操作是把文本分割成有意义的片段&#xff0c;再把这些片段映射为数组&#xff0c;就能够利用各种深度学习的技术来处…

FastStone Capture屏幕长截图软件注册码

FastStone Capture是一款功能强大的电脑屏幕截图、录像软件&#xff0c;并支持图像编辑、注释及分享等使用功能。FastStone Capture可以免费用30天试用&#xff0c;终身版88元单台电脑终身使用&#xff0c;终身更新。不过网上分享的FastStone Capture注册码似乎也可以正常激活&…

Java开发:文件上传和下载

一、文件上传 使用MultipartFile 类型接收参数&#xff1b; 调用上传有两种方式&#xff1a; 方式一&#xff1a;使用curl命令 curl -F "file/data/filename.txt" http://localhost:8080/upload --verbose方式二&#xff1a;使用html&#xff0c;写一个form表单&…

Mysql基本理解

系列文章目录 Mysql的基础理论知识 目录 系列文章目录 文章目录 一、数据库概述 1.数据库概念 2.数据库的作用 3.什么是关系型数据库&#xff1f; 4.Mysql的优点 5.数据库术语 6.SQL语言分类 二、Mysql安装 三、 Mysql使用 1.登录数据库、退出登录 2.创建、列出数据库 3.选择…

Node.JS有什么用?给谁用?怎么学?通俗易懂,超级详细!

现在&#xff0c;nodejs主要是前端的小伙伴来用的。前端小伙伴也不用说去怎么学node&#xff0c;而是把node当做是一个环境。我们利用这个环境去搭建上层的一些应用&#xff0c;去使用一些工具。就像学习Windows一样&#xff0c;我们没有必要深入了解Windows的每一个细节&#…

【hot100-java】【环形链表 II】

印象题 /*** Definition for singly-linked list.* class ListNode {* int val;* ListNode next;* ListNode(int x) {* val x;* next null;* }* }*/ public class Solution {public ListNode detectCycle(ListNode head) {ListNode fasthea…

建筑工程系列专业职称评审条件大全

我们都知道&#xff0c;职称是分很多系列&#xff0c;今天甘建二主要是从建筑工程系列讲起来&#xff0c;从技术员到初级职称再到中级职称然后到高级职称&#xff0c;各个等级的评审条件给您一一解析&#xff0c;赶紧收藏起来。 ✨技术员1️⃣理工类或建筑工程相关专业大学专科…