SVM的基本思想

一、SVM的基本思想

SVM的基本思想是在样本的向量空间中寻找一个超平面,使得两类样本被分割在平面的两端。这样的平面理论上有无穷多个,但SVM的目标是找到一个最优的超平面,即两侧距离超平面最近的样本点到超平面的距离被最大化的超平面。这个最优的超平面所对应的判别模型即为支持向量机。距离超平面最近的样本点被称为支持向量。

二、线性可分情况下的SVM求解

  1. 问题转化

    对于线性可分的情况,SVM的求解可以转化为一个凸优化问题。具体来说,就是找到一个超平面(wx+b=0),使得两类样本点分别位于该平面的两侧,并且距离该平面最近的样本点到平面的距离最大化。

  2. 函数间隔和几何间隔

    • 函数间隔:对于给定的超平面和样本点,样本点到超平面的函数间隔定义为y(wx+b)。但是,函数间隔存在一个问题,即当w和b成倍增加时,函数值也会成倍增加,而超平面并没有改变。因此,需要引入几何间隔。
    • 几何间隔:几何间隔是样本点到超平面的真正距离。它通过对w进行约束(通常假设w的模为1),然后计算样本点到超平面的垂直距离来得到。
  3. 优化问题

    SVM的目标是最大化几何间隔,这可以转化为一个优化问题。具体来说,就是最小化w的模的平方(即||w||^2/2),同时满足所有样本点到超平面的函数间隔大于等于1的约束条件。这个优化问题可以表示为:

其中,n是样本点的数量,x_i和y_i分别是第i个样本点的特征向量和标签。

  1. 拉格朗日乘子法和对偶问题

    为了求解上述优化问题,可以使用拉格朗日乘子法将其转化为一个无约束的优化问题。具体来说,就是引入拉格朗日乘子α_i(i=1,2,...,n),然后构造拉格朗日函数:

接着,对拉格朗日函数分别求w和b的偏导数,并令其等于0,可以得到w和b的表达式(这些表达式中包含了α_i)。然后,将w和b的表达式代入拉格朗日函数,得到一个新的函数(即拉格朗日对偶函数),该函数只包含α_i作为变量。最后,求解这个新的函数的最大值(即对偶问题的解),就可以得到原始优化问题的解。

  1. KKT条件和支持向量

    在求解对偶问题的过程中,需要满足KKT条件(Karush-Kuhn-Tucker条件)。这些条件包括:

    • α_i≥0
    • y_i(wx_i+b)-1≥0
    • α_i(y_i(wx_i+b)-1)=0

    其中,第三个条件表明,只有当样本点位于间隔边界上(即y_i(wx_i+b)=1)时,对应的α_i才可能不为0。这些位于间隔边界上的样本点就是支持向量。

  2. 求解α_i

    通过对偶问题,可以求解出α_i的值。然后,利用α_i和样本点的特征向量x_i,可以求解出w和b的值(通过w的表达式和任意一个支持向量)。

  3. 决策函数

    最后,可以得到SVM的决策函数:f(x)=sign(wx+b)。对于新的样本点x,将其代入决策函数,就可以得到其所属的类别。

三、线性不可分情况下的SVM求解

对于线性不可分的情况,SVM通过引入核函数将样本点映射到高维空间,使得在高维空间中样本点变得线性可分。然后,在高维空间中应用线性可分情况下的SVM求解方法。

  1. 核函数

    核函数的作用是将原始输入空间中的样本点映射到新的特征空间(通常是高维空间)。常用的核函数包括线性核、多项式核、径向基函数(RBF)核(也称为高斯核)等。选择合适的核函数对于SVM的性能至关重要。

  2. 映射后的优化问题

    在引入核函数后,原始的优化问题中的x_i和x_j(表示两个样本点的特征向量)需要被替换为φ(x_i)和φ(x_j)(表示映射后的特征向量)。然后,在新的特征空间中应用线性可分情况下的SVM求解方法。

  3. 软间隔和松弛变量

    对于线性不可分的情况,通常允许某些样本点被错误分类(即位于间隔边界以内或另一侧)。这可以通过引入软间隔和松弛变量来实现。具体来说,就是在优化问题中添加一个惩罚项(即松弛变量的平方和乘以一个正数C),以允许一定的分类错误。同时,约束条件也相应地进行调整(即允许函数间隔小于1)。

  4. 求解过程

    软间隔情况下的SVM求解过程与线性可分情况类似,但需要对拉格朗日函数、KKT条件等进行相应的调整。最终,可以求解出α_i、w和b的值,并得到决策函数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/36455.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【TCP 网络通信(发送端 + 接收端)实例 —— Python】

TCP 网络通信(发送端 接收端)实例 —— Python 1. 引言2. 创建 TCP 服务器(接收端)2.1 代码示例:TCP 服务器2.2 代码解释: 3. 创建 TCP 客户端(发送端)3.1 代码示例:TCP…

day08 接口测试(3)——postman工具使用

下载 postman 的历史版本:Postman 历史版本下载 - 简书 今天开始学习 postman 这个测试工具啦。 【没有所谓的运气🍬,只有绝对的努力✊】 目录 1、postman简介 2、postman的安装 3、给postman安装插件——newman 3.1 环境安装 3.1.1 安…

README写作技巧

做一个项目,首先第一眼看上去要美观,这样才有看下去的动力。做项目亦是如此,如果每一步应付做的话,我想动力也不会太大,最终很大概率会放弃或者进度缓慢。 1.README组成 README是对项目的一个说明,它对观看…

渗透测试---burpsuite(5)web网页端抓包与APP渗透测试

声明:学习素材来自b站up【泷羽Sec】,侵删,若阅读过程中有相关方面的不足,还请指正,本文只做相关技术分享,切莫从事违法等相关行为,本人与泷羽sec团队一律不承担一切后果 视频地址:泷羽---bp&…

【Springboot3+vue3】从零到一搭建Springboot3+vue3前后端分离项目之前端环境搭建

【Springboot3vue3】从零到一搭建Springboot3vue3前后端分离项目之前端环境搭建 2 前端环境搭建2.1 环境准备2.2 创建Vue3项目2.3 项目搭建准备2.4 安装Element Plus2.5 安装axios2.5.1 配置(创建实例,配置请求,响应拦截器)2.5.2 …

11.27-12.5谷粒商城

目录 新增商品 1.上线会员服务 2. 获取分类关联的品牌 3.获取选定分类下的属性分组和属性 4.新增商品vo 5.保存商品信息 6.Spu检索 7.Sku商品检索 新增商品 1.上线会员服务 将会员服务注册到nacos注册中心,启用服务注册发现EnableDiscoveryClient。 同时新增…

深入解析非桥PCI设备的访问和配置方法

往期内容 本文章相关专栏往期内容,PCI/PCIe子系统专栏: 嵌入式系统的内存访问和总线通信机制解析、PCI/PCIe引入 Uart子系统专栏: 专栏地址:Uart子系统 Linux内核早期打印机制与RS485通信技术 – 末片,有专栏内容观看…

ArrayList常见操作源码逐句剖析

目录 前言 正文 1.需要了解的一些字段属性 1.存储 ArrayList 元素的数组缓冲区。 2.集合的大小 3.默认集合容量大小 2.ArrayList对象创建 1.无参构造 2.有参构造1 3.有参构造2 3.添加元素add(E e)以及扩容机制 ​编辑 后言 前言 源码的剖析有助于理解设计模式&…

现代密码学|Rabin密码体制及其数学基础 | 椭圆曲线密码体制及其运算 | DH密钥交换及中间人攻击

文章目录 参考Rabin密码体制及其数学基础中国剩余定理二次剩余Rabin密码体制实例 椭圆曲线密码体制及其运算原理运算规则加密解密实例 DH密钥交换及中间人攻击中间人攻击 参考 现代密码学|Rabin密码体制及其数学基础 现代密码学|椭圆曲线密码体制及其运…

硬件选型规则

光源选型: 先用型号中带H的,没有的选标准的. 光源和光源控制器的搭配需要确保接口一致。 根据型号表中的最佳工作距离和相机的尺寸。 光源控制器选型: 首先选择海康风格系列光源控制器考虑与光源的接口匹配。功率应该满足接近光源功率。检查是否退市…

sharedPreference包的使用总结

文章目录 1 概念介绍2 实现方法3 示例代码我们在上一章回中介绍了"如何自定义评分条"相关的内容,本章回中将介绍如何实现本地存储.闲话休提,让我们一起Talk Flutter吧。 1 概念介绍 Flutter是一套跨平台的UI框架,它不像原生SDK一样提供本地存储功能,因此,我们在…

TCP连接的时候遇到的异常(目标端口没开放)

import asyncioasync def check_port(ip, port, timeout1):"""检查目标 IP 和端口是否开放:param ip: 目标 IP 地址:param port: 目标端口:param timeout: 超时时间(秒)"""try:reader, writer await asyncio.open_connec…

C总结(C语言知识点,深化重难点)

C语言 1.使用C语言的7个步骤2.ASCII码3.提高程序可读性的机巧4.如何使用多种整形5.打印多种整形6.课移植类型:stdint.h和inttypes.h7.浮点数常量8.浮点值的上溢和下溢9.使用数据类型11.常量和C预处理器12.转换说明的意义12.1转换不匹配13.副作用和序列点14.数组简介…

burpsuite(6)暴力破解与验证码识别绕过

声明!!! 学习视频来自B站UP主泷羽sec,如涉及侵权马上删除文章 视频链接:泷羽sec-bilibili 笔记的只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都与本人无关,切莫逾越法律红线,否则后果自负 项目地址:https://github.com/f0ng/cap…

抗DDOS设备

0x00 定义: 抗DDOS设备顾名思义,就是防御DDoS攻击的设备,通常包含三个部分:检测中心、清洗中心和管理中心 检测中心主要负责对流量进行检测,发现流量异常后上报管理中心,由管理中心下发引流策略至清洗中心&#xff0…

systemV信号量与消息队列

目录 引言 ipc简介 ipc在kernel的管理机制(简介) 信号量 理解信号量 原子 结论 mmap 消息队列 接口 引言 在复杂的软件系统中,进程间的协调和通信是确保系统高效、稳定运行的关键。System V是一套历史悠久且功能强大的进程间通信&a…

【CKS最新模拟真题】Falco 的运行时安全性

系列文章目录 【CKS最新模拟真题】获取多个集群的上下文名称并保存到指定文件中 文章目录 系列文章目录参考地址一、TASK二、解题过程1、问题一解题2、问题二解题 参考地址 CKS考试允许打开falco的地址 https://falco.org/docs/reference/rules/supported-fields/ 一、TASK …

Altium Designer学习笔记 32 DRC检查_丝印调整

基于Altium Designer 23学习版,四层板智能小车PCB 更多AD学习笔记:Altium Designer学习笔记 1-5 工程创建_元件库创建Altium Designer学习笔记 6-10 异性元件库创建_原理图绘制Altium Designer学习笔记 11-15 原理图的封装 编译 检查 _PCB封装库的创建Al…

【原生js案例】webApp实现鼠标移入移出相册放大缩小动画

图片相册这种动画效果也很常见,在我们的网站上。鼠标滑入放大图片,滑出就恢复原来的大小。现在我们使用运动定时器来实现这种滑动效果。 感兴趣的可以关注下我的系列课程【webApp之h5端实战】,里面有大量的css3动画效果制作原生知识分析&…

MetaGPT 安装

1. 创建环境 conda create -n metagpt python3.10 && conda activate metagpt2. 可编辑方式安装 git clone --depth 1 https://github.com/geekan/MetaGPT.git cd MetaGPT pip install -e .3. 配置 metagpt --init-config运行命令,在C盘位置C:\Users\325…