李宏毅结构化学习 02

文章目录

  • 一、上篇博文复习
  • 二、Separable Case
  • 三、Non-separable Case
  • 四、Considering Errors
  • 五、Regularization
  • 六、Structured SVM
  • 七、Cutting Plane Algorithm for Structured SVM
  • 八、Multi-class and binary SVM
  • 九、Beyond Structured SVM

一、上篇博文复习

在这里插入图片描述


在这里插入图片描述


图中x表示输入的图片,y表示边界框, ϕ ( x , y ) \phi (x,y) ϕ(x,y)表示由x,y确定的特征强度,w表示需要训练学习的权重,
在这里插入图片描述
F(x,y)如果是线性的,是有很大的局限性。但如果F(x,y)不是线性的,本篇文章的后续推论,可能都不成立。所以这是一个尚待解决的问题。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述

二、Separable Case

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
也就是和y的个数没有关系。


在这里插入图片描述


ρ \rho ρ是两个向量的夹角,范围是[0, π \pi π],所以 ρ \rho ρ越小, cos ⁡ ρ \cos \rho cosρ就越大。
在这里插入图片描述


在这里插入图片描述
这里只证明的 cos ⁡ ρ \cos \rho cosρ的分子随着k的增大而增大,还需要看看分母是什么情况。


在这里插入图片描述


在这里插入图片描述


所有feature扩大两边,并不能加快训练。因为 δ \delta δ扩大两倍的同时,R也扩大了两倍。

在这里插入图片描述

三、Non-separable Case

在实际问题中很难找到Separable case的情况,即很难找到feature可以让正确和错误的分离,也不知道怎么找到它,所以要考虑Non-separable Case。


在这里插入图片描述


在这里插入图片描述
C的最小值是零。


在这里插入图片描述


在这里插入图片描述
除了边界值不能微分,其他地方都能微分。


在这里插入图片描述


四、Considering Errors

在这里插入图片描述
我们希望所选的 w w w, 使得y与正确的那个越接近,计算的 x ⋅ ϕ x \cdot \phi xϕ ,越大,即与正确的越接近。
这样做的好处是,即使testing和training有一些差距,即使testing的第一名不是正确的,但是所输出的第一名和正确的差距不会很大。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
上界 C 变小,可能会使 C’ 随之也变小。


在这里插入图片描述


在这里插入图片描述


五、Regularization

在这里插入图片描述


在这里插入图片描述


六、Structured SVM

在这里插入图片描述
因为我们要最小化C,所以上图中的倒数第三行和倒数第二行等价的。


请添加图片描述


习惯上,这时我们就把 C n C^n Cn写为 ε n \varepsilon^n εn
在这里插入图片描述
本来是找w,去最小化C。即找到w后, C n C^n Cn就被决定了。
但是在黄色框中,定好w后, ε n \varepsilon^n εn并不能确定。所以条件要改成:Find w , ε 1 , ⋯ , ε n w,\varepsilon^1,\cdots,\varepsilon^n w,ε1,,εn minimizing C


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
由于约束条件,即不等式太多,可能会令w找不到,所以要放宽条件,不等式右边减去一个 ε \varepsilon ε ( ε ≥ 0 \varepsilon \ge0 ε0)。但 ε \varepsilon ε又不能太大,否则w取任何值都能满足不等式,约束条件就失去意义了。


在这里插入图片描述


在这里插入图片描述


七、Cutting Plane Algorithm for Structured SVM

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


下面以 object detection 为例:

在这里插入图片描述


在这里插入图片描述
这里相当于 y ˉ \bar y yˉ是有个函数公式,给定w后,直接能算出来哪个y最大。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


八、Multi-class and binary SVM

在这里插入图片描述
这里y代表类别。y为哪个类别,就把 x ⃗ \vec x x 放在 ϕ ( x , y ) \phi(x,y) ϕ(x,y)对应的维度上。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
这里我们可以定义,只要类别不一样就定义为 Δ ( y ^ n , y ) = 1 \Delta (\widehat y^n,y)=1 Δ(y n,y)=1


九、Beyond Structured SVM

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1536883.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Android Framework(六)WMS-窗口显示流程——窗口内容绘制与显示

文章目录 窗口显示流程明确目标 窗户内容绘制与显示流程窗口Surface状态完整流程图 应用端处理finishDrawingWindow 的触发 system_service处理WindowState状态 -- COMMIT_DRAW_PENDING本次layout 流程简述 窗口显示流程 目前窗口的显示到了最后一步。 在 addWindow 流程中&…

基于Python的自然语言处理系列(10):使用双向LSTM进行文本分类

在前一篇文章中,我们介绍了如何使用RNN进行文本分类。在这篇文章中,我们将进一步优化模型,使用双向多层LSTM来替代RNN,从而提高模型在序列数据上的表现。LSTM通过引入一个额外的记忆单元(cell state)来解决…

24.Redis实现全局唯一ID

是一种分布式系统下用来生成全局唯一ID的工具。 特点 1.唯一性 2.高可用 3.高性能 4.递增性,数据也要保持一种递增,有利于数据库进行查询。 5.安全性 全局唯一ID的生成策略 1.UUID(没有顺序,字符串类型,效率不高) 2.Redis…

【电路笔记】-差分运算放大器

差分运算放大器 文章目录 差分运算放大器1、概述2、差分运算放大器表示2.1 差分模式2.2 减法器模式3、差分放大器示例3.1 相关电阻3.2 惠斯通桥3.3 光/温度检测4、仪表放大器5、总结1、概述 在之前的文章中,我们讨论了反相运算放大器和同相运算放大器,我们考虑了在运算放大器…

floodfill算法(二)

目录 一、太平洋大西洋水流问题 1. 题目链接:417. 太平洋大西洋水流问题 2. 题目描述: 3. 解法 🌴算法思路: 🌴算法代码: 二、扫雷游戏 1. 题目链接:529. 扫雷游戏 2. 题目描述&#xf…

softmax回归的从零实现(附代码)

softmax回归是一个多分类模型,但是他跟线性回归一样将输入特征与权重做线性叠加,与线性不同的是他有多个输出,输出的个数对应分类标签的个数,比如四个特征和三种输出动物类别,则权重包含12个标量(带下标的w…

深度学习之线性代数预备知识点

概念定义公式/案例标量(Scalar)一个单独的数值,表示单一的量。例如:5, 3.14, -2向量 (Vector)一维数组,表示具有方向和大小的量。 ,表示三维空间中的向量 模(Magnitude)向量的长度,也称为范数(通常为L2范数…

HCIA--实验十六:ACL通信实验(2)

2.高级ACL配置 一、实验内容 1.需求/要求: 使用三台PC和一台交换机,在交换机上配置高级ACL,测试PC1、PC2、PC3间的连通性。 二、实验过程 1.拓扑图: 2.步骤: 1.给PC3配置ip地址: 2.给交换机SW3配置高…

Hello,Spring Boot...

今天开启了Spring Boot学习之旅。 首先就是,JDK、Maven、IDEA以及各种官网的下载、安装与配置 然后通过组件创建小类,最让人头痛的就是,这个spring-boot-starter-thymeleaf,下错版本了 其他的一切顺利,自动化明显 最后…

2024最新版mysql数据库表的查询操作-总结

序言 1、MySQL表操作(创建表,查询表结构,更改表字段等), 2、MySQL的数据类型(CHAR、VARCHAR、BLOB,等), 本节比较重要,对数据表数据进行查询操作,其中可能大家不熟悉的就对于INNER JOIN(内连接)、LEFT JOIN…

Learn ComputeShader 15 Grass

1.Using Blender to create a single grass clump 首先blender与unity的坐标轴不同,z轴向上,不是y轴 通过小键盘的数字键可以快速切换视图,选中物体以后按下小键盘的点可以将物体聚焦于屏幕中心 首先我们创建一个平面,宽度为0.2…

SpringBoot中使用EasyExcel并行导出多个excel文件并压缩zip后下载

❃博主首页 &#xff1a; 「码到三十五」 &#xff0c;同名公众号 :「码到三十五」&#xff0c;wx号 : 「liwu0213」 ☠博主专栏 &#xff1a; <mysql高手> <elasticsearch高手> <源码解读> <java核心> <面试攻关> ♝博主的话 &#xff1a…

SysML图例-农业无人机

DDD领域驱动设计批评文集>> 《软件方法》强化自测题集>> 《软件方法》各章合集>>

dll修复工具4DDiG DLL Fixer,解决电脑dll丢失问题

4DDiG DLL Fixer是一款专业的DLL修复工具&#xff0c;旨在解决Windows系统中各种DLL相关问题。该工具能够快速全面地扫描计算机&#xff0c;检测并修复导致程序功能异常的DLL错误。它支持一键式操作&#xff0c;自动扫描、识别和替换缺失或损坏的DLL文件&#xff0c;从而帮助用…

推荐3款AIai论文大纲一键生成文献,精选整理!

在当前的学术写作环境中&#xff0c;AI论文大纲生成工具已经成为许多学者和学生的重要助手。这些工具不仅能够快速生成高质量的论文大纲&#xff0c;还能提供内容填充、文献引用和查重修改等全方位的服务。以下是三款值得推荐的AI论文大纲一键生成文献工具&#xff1a;千笔-AIP…

爬虫--翻页tips

免责声明&#xff1a;本文仅做分享&#xff01; 伪线程 from DrissionPage import ChromiumPage import timepage ChromiumPage() page.get("https://you.ctrip.com/sight/taian746.html") # 初始化 第0页 index_page 0# 翻页点击函数 sleep def page_turn():page…

C/C++语言基础--从C到C++的不同(下),15个部分说明C与C++的不同

本专栏目的 更新C/C的基础语法&#xff0c;包括C的一些新特性 前言 1-10在上篇C/C语言基础–从C到C的不同(上&#xff09;&#xff1b;当然C和C的不同还有很多&#xff0c;本人暂时只总结这些&#xff0c;其他的慢慢更新&#xff1b;上一篇C/C语言基础–从C到C的不同(上&…

node.js 中的进程和线程工作原理

本文所有的代码均基于 node.js 14 LTS 版本分析 概念 进程是对正在运行中的程序的一个抽象&#xff0c;是系统进行资源分配和调度的基本单位&#xff0c;操作系统的其他所有内容都是围绕着进程展开的 线程是操作系统能够进行运算调度的最小单位&#xff0c;其是进程中的一个执…

康养小站:长者舒缓疼痛的港湾

【导语】在老龄化日益加剧的当下&#xff0c;如何关爱和照顾好长者&#xff0c;成为社会关注的焦点。近日&#xff0c;笔者走进深圳宝安区一家专注于长者康养的社区小站&#xff0c;探访它如何帮助长者缓解疼痛&#xff0c;提高生活质量。 随着我国人口老龄化问题日益显著&…

算法:30.串联所有单词的子串

题目 链接&#xff1a;leetcode链接 思路分析&#xff08;滑动窗口&#xff09; 这道题目类似寻找异位词的题目&#xff0c;我认为是寻找异位词的升级版 传送门:寻找异位词 为什么说像呢&#xff1f; 注意&#xff1a;这道题目中words数组里面的字符串长度都是相同的&…