【数据增强】Mixup

方法来源

Mixup是2018年发表在ICLR上的一种数据增强方法,它通过将多组不同数据集的样本进行线性组合,生成新的样本,从而扩充数据集。
核心思想是从每个batch中随机选择两张图像,并以一定比例混合生成新的图像,新图像的标签也是进行线性组合得到的。
需要注意的是,全部训练过程都只采用混合的新图像训练,原始图像不参与训练过程
Mixup是发源于CV领域的一种数据增强技术,发展到现在不仅在CV领域,在NLP、时间序列预测等领域都有其踪影,是一种提分神器。
Mixup也可以增加数据集的多样性,从而降低模型的方差,提高模型的鲁棒性。

paper:mixup: Beyond Empirical Risk Minimization
在这里插入图片描述

存在问题:大型深度神经网络功能强大,但表现出不良行为,如对记忆和对抗性实例的敏感性。
Mixup是一种简单有效的数据增强方法(学习原则),能够缓解这些问题。

Mixup核心公式

在这里插入图片描述
其中 x i x_i xi y i y_i yi x j x_j xj y j y_j yj都是从训练集中随机选择的,其中 λ \lambda λ取值于 β \beta β分布,范围为0-1。
y是one-hot标签,⽐如 y i y_i yi的标签为[0,0,1], y j y_j yj的标签为[1,0,0],此时 λ \lambda λ为0.2,那么此时的标签就变为0.2*[0,0,1] + 0.8*[1,0,0] = [0.8,0,0.2],其实Mixup的立意很简单,就是通过这种混合的模型来增强模型的泛化性

PyTorch代码

在这里插入图片描述

图像领域的应用

根据给定的训练数据集来训练和更新神经网络体系结构中的参数。然而,由于培训数据只涵盖了整个可能数据分布的某一部分,因此网络可能过于适合分布的“可见”部分。因此,我们拥有进行训练的数据越多,理论上就能更好地描述整个分布。
虽然我们拥有的数据数量有限,但我们总是可以尝试稍微改变图像,并将它们作为“新”样本输入网络进行培训。这个过程被称为数据增强。

图像Mixup的简单可视化图

参考文章

一种巧妙且简单的数据增强方法 - MixUp 小综述
在PyTorch中用Mixup增强神经网络
数据增强黑科技Mixup:9篇顶会论文带你了解Mixup发展脉络
数据增强实测之mixup
【pytorch】使用mixup技术扩充数据集进行训练

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/3792.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

基于图论的时间序列数据平稳性与连通性分析:利用图形、数学和 Python 揭示时间序列数据中的隐藏模式

时间序列数据表示了一个随时间记录的值的序列。理解这些序列内部的关系,尤其是在多元或复杂的时间序列数据中,不仅仅局限于随时间绘制数据点(这并不是说这种做法不好)。通过将时间序列数据转换为图,我们可以揭示数据片段内部隐藏的连接、模式和关系,帮助我们发现平稳性和时间连…

Qt学习笔记第41到50讲

第41讲 UI美化遗留问题解决 如上图所示目前记事本的雏形已现,但是还是有待优化,比如右下角的拖动问题。 解决方法: ①首先修改了Widget类的构造函数。 Widget::Widget(QWidget *parent) : QWidget(parent) , ui(new Ui::Widget) {ui->s…

社区养老服务小程序ssm+论文源码调试讲解

第2章 开发环境与技术 校车购票微信小程序的编码实现需要搭建一定的环境和使用相应的技术,接下来的内容就是对校车购票微信小程序用到的技术和工具进行介绍。 2.1 MYSQL数据库 本课题所开发的应用程序在数据操作方面是不可预知的,是经常变动的&#xf…

【RabbitMQ】03-交换机

1. 交换机 2. Fanout交换机 广播。生产者向exchange发消息 SpringBootTest public class SpringAmqpTest {Autowiredpublic RabbitTemplate rabbitTemplate;Testvoid testSimple() {String exchangName "hmall.fabout";rabbitTemplate.convertAndSend(exchangName…

Java基础-集合

(创作不易,感谢有你,你的支持,就是我前行的最大动力,如果看完对你有帮助,请留下您的足迹) 目录 前言 一、Java集合框架概述 二、Collection接口及其实现 2.1 Collection接口 2.2 List接口及其实现 …

K8S详解(5万字详细教程)

目录 ​编辑 一、集群管理命令 二、命名空间 1. 获取命名空间列表 2. 创建命名空间 3. 删除命名空间 4. 查看命名空间详情 三、Pod 1. Pod概述 2. Pod相位状态 3. 管理命令 3.1 获取命名空间下容器(pod)列表 3.2 查看pod的详细信息 3.3 创建 && 运行 3.4 …

AI驱动的图像文本提取【Llama 3.2-Vision】

本月初,我尝试了书籍封面识别,将 YOLOv10、EasyOCR 和 Llama 3 结合成一个无缝工作流程。结果如何?我自信地从书籍封面中提取标题和作者,就像这是我的新超能力一样。你可以在这篇文章中查看这一旅程:使用自定义 Yolov1…

打造你的Pokemon大师:深度学习多分类模型构建与本地部署全攻略

打造你的Pokemon大师:深度学习多分类模型构建与本地部署全攻略 引言 在这篇文章中,我将分享如何从头构建一个用于多分类任务的神经网络,并将其部署到本地环境。这是一个实践性质的教程,适合那些对深度学习模型部署感兴趣的初学者…

TikTok云手机怎样进行TikTok矩阵运营?

由于地区限制,国内无法直接访问TikTok。本文将介绍如何借助海外版TikTok云手机实现多账号管理,也就是矩阵运营,并探讨这种方式对提升工作效率的优势。 常见的多账号管理方式 许多人尝试通过VPN访问TikTok,但通常会遇到连接不稳定、…

光控资本:进入超级事件周 A股将如何运行

从国内来看,近期最重要的作业无疑是十四届全国人大常委会第十二次会议,该会议将于11月4日至8日在北京举办。商场广泛预期,本次会议将审议上调政府债务限额的议题,并或许推进新一轮的债务化解作业。这些方针意向有望为商场带来新的…

D59【python 接口自动化学习】- python基础之异常

day59 捕获异常常见问题 学习日期:20241105 学习目标:异常 -- 75 避坑指南:编写捕获异常程序时经常出现的问题 学习笔记: 捕获位置设置不当 设置范围不当 捕获处理设置不当 嵌套try-except语法错误 总结 位置,范围…

“高效开发之路:用Spring MVC构建健壮的企业级应用”

一、SpringMVC框架概念: (一)概述 SpringMVC是Spring框架的一个模块,Spring和SpringMVC无需中间整合层整合。该模块是一个基于MVC的web框架。 作用:只要需要前后端通信,就需要springMVC帮我完成&#xff…

Unity使用Spine导致设备发烫

spine制作过程中,美术同学使用裁剪技术 将一个特效文件做固定范围显示,实际上非常消耗CPU算力。 解决办法: 交给程序来实现裁剪,只要加Mask组件即可

if-else语句+例题练手(2)

前面我们讲过循环语句的for、while、do-while的使用,即组成C语言中的循环结构,而除了循环其实还有顺序和选择,顺序结构就是顺着程序中的代码一行一行执行下去,而选择为分支结构,有if语句和switch语句,今天先讲if语句和…

HTTP服务器测试与优化

目录 1 搭建一个基础的HTTP服务器 2 长连接测试 3 测试错误报文的处理 4 测试业务处理耗时超过超时时间的处理 5 测试同时收到多条正常请求 6 大文件传输测试 7 压力测试 1 搭建一个基础的HTTP服务器 在这个部分,我们需要搭建一个最简单的HTTP服务器&#xf…

【spring】Cookie和Session的设置与获取(@CookieValue()和@SessionAttribute())

💐个人主页:初晴~ 📚相关专栏:程序猿的春天 获取Cookie 使用 Servlet 获取Cookie: Spring MVC 是基于 Servlet API 构建的原始 Web 框架,也是在 Servlet 的基础上实现的 RestController RequestMapping…

网页版五子棋—— WebSocket 协议

目录 前言 一、背景介绍 二、原理解析 1.连接过程(握手) 2.报文格式 三、代码示例 1.服务端代码 (1)TestAPI 类 (2)WebSocketConfig 类 2.客户端代码 3.代码演示 结尾 前言 从本篇文章开始&am…

【Go语言】| 第2课:变量声明与、初始化、匿名变量和作用域

😎 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。 🤓 同时欢迎大家关注其他专栏,我将分享Web前后端开发、人工智能、机器学习、深…

K8S简单部署,以及UI界面配置

准备两台服务器K8Smaster和K8Sminion 分别在两台服务器上执行以下代码 #添加hosts解析&#xff1b; cat >/etc/hosts<<EOF 127.0.0.1 localhost localhost.localdomain 192.168.45.133 master1 192.168.45.135 node2 EOF #临时关闭selinux和防火墙&#xff1b; sed …

创业初期,找了个没有成本的地方当办公场地

大家好&#xff0c;我是小悟。 如果我问你&#xff0c;创业的第一步是什么&#xff1f;或许你会说资金、团队、市场定位&#xff0c;这些确实都是创业不可或缺的因素。找办公场地也是很重要的一个环节&#xff0c;但如果我现在告诉你&#xff0c;把图书馆作为办公场地&#xf…