非极大值抑制(Non-Maximum Suppression,简称NMS)是什么?

在这里插入图片描述

非极大值抑制Non-Maximum Suppression,简称NMS)是一种常用于目标检测任务中的后处理技术,主要用于从多个候选框中选出最合适的边界框,并抑制那些与最优候选框重叠度高分类置信度低的框。


NMS的目的:

目标检测算法中,经过分类和边界框回归后,可能会得到多个 重叠重复 的候选框(Region Proposals),这些框可能是针对同一个目标生成的。NMS的目的是从这些重叠的框中 选出最合适的框,并去除那些冗余的框,以减少重复检测的结果


NMS的工作原理:

  1. 输入框排序:首先,将所有候选框按照 置信度(通常是目标分类的概率或得分)进行排序,得分高的框会排在前面。

  2. 选择框:选择得分最高的候选框作为当前的最佳框,并将其加入最终检测结果。

  3. 计算重叠度(IoU):对剩下的候选框与当前选择的框,计算它们的 交并比(Intersection over Union,IoU)。IoU 是两个框的交集区域与它们的并集区域的比值

  4. 抑制框:如果某个候选框与当前选定框的IoU大于某个设定的阈值(通常为0.5),则认为这个候选框与当前框有较高的重叠,它代表了同一个物体,因此会被 抑制(去除)。

  5. 重复步骤:继续选择得分最高的框,并重复步骤3和步骤4,直到所有候选框都被处理完。


非极大值抑制的流程:

  1. 对所有候选框按照置信度排序。
  2. 选择置信度最高的框,加入最终结果。
  3. 对其余候选框,计算与选定框的IoU
  4. 如果IoU大于预设阈值,则去除该框。
  5. 重复步骤2至4,直到所有候选框处理完毕。

举个例子:

假设有四个候选框:框A、B、C、D,分别有以下得分:

  • 框A:得分 0.9
  • 框B:得分 0.8
  • 框C:得分 0.7
  • 框D:得分 0.6

首先按得分排序得到:A > B > C > D。然后选择得分最高框A,接下来计算框B、C、D与A的IoU,假设:

  • 框A与B的IoU为0.6
  • 框A与C的IoU为0.4
  • 框A与D的IoU为0.2

假设设定的IoU阈值为0.5,那么框A与B的重叠度超过了0.5,因此框B会被抑制,去除。接着再检查框C和框D,继续按照IoU的规则去除冗余框。最终,留下框A、C和D。


NMS的参数:

  • 置信度阈值:通常在筛选框时,设定一个最低的置信度阈值,低于这个阈值的框会被丢弃。
  • IoU阈值:设定IoU的阈值,用来判断两个框是否属于同一个物体。当IoU超过这个阈值时,较低得分的框会被抑制。

为什么需要NMS?

在目标检测中,由于候选区域生成算法(如选择性搜索)和目标检测算法(如Faster R-CNN)都会 生成多个框,这些框可能是不同的区域,但是它们可能代表同一个物体。NMS通过抑制冗余的重叠框,保留最有可能代表目标的框,减少重复检测的结果


总结:

非极大值抑制(NMS) 是一种用于去除重复框的算法,它根据框的置信度重叠度(IoU)筛选最合适的边界框,以提高目标检测的精度和效率。在目标检测任务中,NMS能够有效地避免多次检测到同一个物体

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/35903.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【Java】A *算法的应用

代码和测试图片下载地址: https://download.csdn.net/download/r77683962/90089371 这个地图里黑色部分是不能通过的,白色部分是可以通过的,这个算法没问题,有点感觉效率不太高。。。。。 效果: 源代码PathFind.java&…

日本IT|企业需要什么样的技术?

日本IT企业所需的技术非常多样化,涵盖了多个领域和方面。以下是一些日本IT企业通常所需的主要技术: 一、编程语言与工具 编程语言:Java、Python、C、C#、PHP等是日本IT企业常用的编程语言。这些语言在软件开发、数据分析、网络应用等方面都…

刘铁猛C#入门 030 泛型,partial类,枚举,结构

泛型(generic)无处不在 为什么需要泛型:避免成员膨胀或者类型膨胀 正交性:泛型类型(类/接口/委托/......)泛型成员(属性/方法/字段/....类型方法的参数推断 泛型接口/类的 类型参数不只有一个泛型与委托、lambda表达式实现泛型接口类时 ,实现…

视频加密的好处与加密方法分析2024

视频内容的多样化不止局限于电视、电影,在日常培训学习中也是必不可少的。那么对于做知识付费的人来说,视频内容的安全性就尤为重要。视频加密也就i随之兴起,为视频内容安全多了一层保障,那么主要体现下那几个方面呢?可…

鸿蒙UI开发——亮/暗色模式适配

1、概 述 系统存在深浅色两种显示模式,为了给用户更好的使用体验,应用最好适配暗色和亮色两种模式。从应用与系统配置关联的角度来看,适配暗色和亮色模式可以分为下面两种情况: 应用跟随系统的深浅色模式; 应用主动设…

三菱伺服JET产品线(选型说明)

伺服放大器功能提升 伺服放大器MELSERVO-JET系列为进一步优化了独家控制引擎的高性能伺服放大器。 可通过与支持CC-LinK IE TSN的运动控制器的同步通信,进行高 速、高精度的运动控制。 除了旋转型伺服电机以外,还支持线性伺服电机。MR-JET-G-N1支持EtherCAT。 旋转型伺服电机 …

HarmonyNext如何判断上下分屏

鸿蒙系统支持上下分屏,可以同时使用两个应用,比如: 有时候我们需要在分屏的时候处理相关逻辑,那到底该如何处理了, 首先在UIAbility下的onWindowStageCreate中进行监听 //监听窗口变化let windowClass: window.Window…

寄存器点灯

1.keil创建工程。(不再概述) 2.需要添加启动文件。所以添加库文件中的第二个。 3.启动顺序。上电后先初始化堆栈指针,再运行该汇编,最后跳入main函数,系统初始化是初始化时钟的,暂时不需要,屏蔽…

tomcat 运行加载机制解析

tomcat 运行加载机制 从tomcat jar包的加载顺序: tomcat的具体运行加载 可以从 start、setclasspath、catalina文件中看出来: start.bat执行 去找bin目录下的catalina.bat,catalina 或去找 bin\setenv.bat以获取标准环境变量,然后去找bin\…

OLED显示图片,文字

显示图片 1.这是随便一张的图片,自己可以随便截图一张 2.单击图片,右边选择编辑 3.如下操作 4.然后,这个水平和垂直的值的设置要根据你所使用的屏幕有多少个像素点,我当前使用的是0.96寸OLED屏幕,也就是12864&#x…

猿辅导持续布局AI赋能教育领域,助推教育行业数字化转型

近日,由人民网主办的“AI之夜”活动在北京隆重举行。“AI之夜”活动旨在展示中国在人工智能领域的最新成果和创新应用,推动行业的交流与合作。活动现场,来自不同领域的专家们通过主题演讲、圆桌讨论和案例分享等形式,全面呈现了中…

Zotero版本兼容问题,无法安装插件“%s”

1.问题:zotero-better-notes与zotero版本不兼容 安装插件zotero-better-notes时,出现插件安装失败提示:无法安装插件“%S"。他可能无法与该版本的Zotero兼容 zotero-better-notes:是一款论文阅读笔记插件,之前一…

Profinet IO从站数据 转 opc ua项目案例

目录 1 案例说明 2 VFBOX网关工作原理 3 准备工作 4 使用PRONETA软件获取PROFINET IO从站的配置信息 5 设置网关采集PROFINETIO从站设备数据 6 启动OPC UA协议转发采集的数据 7 选择槽号和数据地址 8 选择子槽号 9 案例总结 1 案例说明 设置网关采集ProfinetIO从站设…

android studio 读写文件操作(应用场景二)

android studio版本:2023.3.1 patch2 例程:readtextviewIDsaveandread 本例程是个过渡例程,如果单是实现下图的目的有更简单的方法,但这个方法是下一步工作的基础,所以一定要做。 例程功能:将两个textvi…

基于SSM框架企业人事管理系统的设计与实现

系统合集跳转 源码获取链接 一、系统环境 运行环境: 最好是java jdk 1.8,我们在这个平台上运行的。其他版本理论上也可以。 IDE环境: Eclipse,Myeclipse,IDEA或者Spring Tool Suite都可以 tomcat环境: Tomcat 7.x,8.x,9.x版本均可 操作系统…

百度智能云 CHPC: 使用 BtuneAK对基因测序软件进行加速

背景 本文主要介绍在 CHPC 平台使用 BtuneAK 自动化加速组件,可以直接对BWA、FastQC、Picard、Trimmomatic等业务端到端时长加速。 Btune 简单介绍 BtunePK介绍 BtunePK 是百度自研的一款性能分析和调优工具,兼容Intel、AMD、ARM三个CPU平台&#xff0…

Power BI - 批量导入数据

1.简单介绍 假定已经使用Power Automate Desktop(微软的RPA产品,是Power Platform平台的其中一个产品)从福布斯中文网获取了各地区的2024年的财富数据如下, 现在想批量导入数据到Power BI中,分析一下各地区的产业以及财富情况 2.具体说明 …

实现跨平台 SSH 连接:从 macOS 到 Windows WSL 的完整解决方案20241203

🌐 实现跨平台 SSH 连接:从 macOS 到 Windows WSL 的完整解决方案 ✨ 引言 随着跨平台开发的普及,开发者经常需要在多系统环境中切换和协作。尤其是在 macOS 和 Windows 混合使用的开发环境中,通过 SSH 远程访问和管理 Windows …

【css】基础(二)

本专栏内容为:前端专栏 记录学习前端,分为若干个子专栏,html js css vue等 💓博主csdn个人主页:小小unicorn ⏩专栏分类:css专栏 🚚代码仓库:小小unicorn的代码仓库🚚 &a…

2024通信工程师-中级-互联网技术备考经验

考试简介 全国通信专业技术人员职业水平考试,是由国家人力资源和社会保障部、工业和信息化部领导下的国家级考试。根据原人事部、信息产业部文件(国人部发[2006]10号),通信专业技术人员职业水平评价,纳入全国专业技术人…