机器学习-SVM

机器学习-SVM

news/2024/9/28 7:29:29/文章来源:https://blog.csdn.net/junxinsiwo/article/details/142588358

线性感知机分类
支持向量机

线性感知机（Perceptron）

感知机是线性二值分类器。

注意：什么是线性？线性分割面就是，就是在分割面中，任意两个的连线也在分割面中，这个分割面，就是线性分割面。

f(x,w,b)=sign(wx+b)

wx+b>0, f=1

wx+b<0, f=-1

为什么分割面能写成 wx+b=0？w 一个向量。

对于普通的方程 y=kx+b,那么我们可以写成 kx-y+b=0,写成向量方程就是：

当k=1时，w(1,-1) 如下图知，w 是分割面的法向量。

感知机--目标函数

最小化错误率：

I 函数是：当预测值 f() 与实际值 y 不相等时，I=1，相等是 I=0 。所以求和为错误的样本数。

我们可以转换成后边的函数，sign 函数是：wx+b>0 是函数值为1，wx+b<=0 时函数值为-1.

那么如果分对：sign 与 y 符号相同，相减为 0，如果分错，sign 与 y 符号相反，那么相减为2 或者 -2 所以需要除以2，就是分错样本数了。

由于sign() 函数不是处处可导，给算法设计带来困难。所以我们换一个容易的策略。

函数 ①

这个函数只统计分错样本，所以如果全分对L=0，如果有分错样本时L>0 (<0,所以函数前边有个负号）

结论：线性可分时，最小化 L 等价于最小化错误率。

注意：如果不是线性不可分时，这个结论不成立。

如：w1xi+b=0.2 分错

w1xj+b=0.3 分错 L1=0.5

w2xk+b=0.6 分错： L2=0.6

当为 w1 是有两个样本点分错了错误率为2，L1=0.5 ，但是当为 w2 时有一个样本点分错了错误率为1， L2=0.6>L1

现在我们要最小化函数 ①，那么我对函数① 分别对w 和 b 求偏导。（-xiyi,-yi）

我们用梯度下降法来找函数① 的极值。

w = w + p*y_i*x_i

b = b + p*y_i

是学习率。

算法步骤：

随机设定：w ，b 的值
用当前（w，b）轮流对所有的样本点分类，如果分错，更新(w,b) 的，继续。
重复步骤2直到所有的点都被分对

感知机的不足：

有无穷多个可行解
由于感知机是贪婪算法，所以结果依赖初始值和误分点的顺序。
线性限制（对于线性不可分的特征空间，线性感知机无能为力）

不足 1 不足 3

线性感知机有这些不足，接下来我们看看在支持向量中是怎么弥补的。

支持向量机（Support Vector Machine）

线性可分：硬间隔SVM
适用于线性不可分：软间隔SVM
SVM对偶问题和解的性质
非线性：Kernel SVM

硬间隔 SVM

图 1 图 2 图 3

看图1，这里有两个分割线，到底哪个好呢？对于新数据（哪个方框）到底应该属于哪一类呢？我看到超平面不同，对新数据的影响不同。

看图2，间隔：分界面到最近样本距离（的两倍）。

我们认为使间隔最大的分界面是最好的分界面，因为间隔最大，将来落在间隔内的新数据更够跟准确的分到所属的类中。

最大间隔分类器是使得间隔宽度最大的线性分类器。

看图3 要求：对正样本wx+b>=1

对负样本wx+b<=-1

原因：由于wx+b>0 那么肯定存在一个非常接近0的ε 使 wx+b>=ε ,两边同时除以 ε 得 wx/ε+b/ε>=1，那么我将w/ε=w,b/ε=b(先的未知数),于是就有wx+b>=1,同理wx+b<=-1

求间隔（margin）：

M 由向量投影公式：投影=向量与投影方向单位向量的内积。

（第二个式子是根据直角三角形计算出来的）将conθ 带入二式就得到了M的值。

wx+b>=1 , y=1

wx+b<=1 , y=-1 所以：y(wx+b)>=1

我们要最大，就等价于最小化，因为：，而是一个单调递增函数，最小化的也就是最小化 x ，同理最小化化，优化问题，前边加一个1/2 系数，对优化问题没有影响，添加一个1/2 系数是为了对二次求导有一个2系数相消。

这样就转化为一个关于 w 和 b 的二次规划问题：

软间隔 SVM

感知机是有无穷多个可行解，现在硬间隔SVM 通过最大间隔，有唯一解。那么目前还有什么缺点？对噪音的处理。现在都是要求线性可分，如果存在噪音，那么将会出现震荡。那么我们接下来，看看软间隔ＳＶＭ是怎么解决噪音问题的。

　如果存在噪音点。

软间隔ＳＶＭ　通过引入松弛变量ξi，使得错分样本得到惩罚（注意：当还没有找到最优解时，一些非噪音点也会遭到惩罚）。

最小化松弛项，同时最大化间隔。

minimize 错分样本对应的 ξi>=1,所以：Σiξi>=错误样本个数。

硬间隔 VS 软间隔

　　

硬间隔ＳＶＭ软间隔ＳＶＭ

拉格朗日函数

为什么要引入拉格朗日函数呢?对于一般函数我们要极值，我们只需求导等于零即可。那么对于带约束的函数求导，我们怎么求他的极值。我们用拉格朗日乘子，将目标函数和约束函数写到一个新函数中，对这个新函数我们求导等于零即可。

优化问题

对每个约束引入拉格朗日乘子 ai,ui 得到：

且 a>=0,u>=0

这个拉个朗函数，根据 α和u 求最大，然后根据：w，b， ξ 求最小。

那么经这转换，最后求出解还是原问题的解吗？

分析：内部最大化：当不成立，也就是小于 0 ，根据式子值，α的系数是正数且 α>=0，那么这时根据 α 求拉格朗日函数的最大值为正无穷。

同理当不成立时，且 u>=0 ，拉格朗日函数最大值为正无穷。

当成立时，，α的系数是负数，且α>=0 ,所以只有 α=0 时，拉个朗日函数的最大值为0.

当成立时，，u 的系数是负数，且u>=0 ,所以只有 u=0 时，拉个朗日函数的最大值为0.

结论：当成立时，拉格朗日函数根据 a,u求得最大值为0，则此在根据w，b,ξ 求最小值，就是原函数的最小值

当不成立时，，拉格朗日函数根据 a,u求得最大值为正无穷，则此在根据w，b,ξ 求最小值，没有意义。

图1 图2

原问题就像图1

朗格朗日函数就像图2

拉个朗日的对偶问题：

且ai>=0,ui>=0

对偶函数只是将最大化和最小化交换了一下位置。那么优化对偶函数的解和拉格朗日函数的解是一致的吗？

凸优化是一样的。因为凸规划满足KKD条件。凸规划问题就是：约束是凸集，目标函数是凸函数。

求极值问题，L对 w,b,ξ 求导等于零。

式（1）得到：，带入L：

需满足式2,3和对偶条件：

ai>=0
ui>=0
C-ai-ui=0
Σyiai=0

使用ui=C-ai 消掉ui，得到最终的对偶问题：

由于，预测函数变为：

求b：满足 0<ai<C 的i 对应的支持向量，解yif(xi)=1得到b

对偶问题有点，只需内积，不需 x 具体值。这样也就可以用核函数了。

KKT 条件

最优化问题，最后变成求KKT条件。只要满足KKT 条件的解，就是原问题的最优解。

非线性SVM

对于线性可分数据，线性SVM表现很好了。

如果训练数据本身存在复杂非线性关系（在给定的特征空间中），很难用线性模型较好的处理。

解决办法：通过一个函数，将原来的特征空间中的样本，映射到高维的特征空间中:

将原来的数据的平方作为第二维。

原始空间中任意形状的两个区域，总是可以在某些高维特征空间中映射成线性可分的区域。

将到原点的距离最为第四维的数据。

核函数：

之前我们讲过，SVM分类器的训练和预测都仅依赖于样本对的内积值 K（xi,xj）=xi^Txj

核函数对应某个特征空间中的内积。

核函数例子：

线性：（这就是内积定义，就是映射的还是原来的空间）
p次多项式：
高斯核（RBF核）（特征空间是无限维空间，此核可以用来逼近任意复杂的分类面）（σ 参数需要自己调）
Sigmoir：

注意：引入Kernel 的同时带来高计算复杂度：

Kernel SVM 中，支持向量个数随样本数增多。
Kernel SVM 问题求解至少是n^2 复杂度。（因为我们需要计算每个特性向量与其他特征向量的内积）

最著名的两个工具包

LIBSVM:

http://www.csie.ntu.edu.tw/~cjlin/libsvm/

SVM Light:

http://www.cs.cornell.edu/People/tj/svm_light/

liblinear-1.93：这个是针对线性可分的数据，做了很多优化，比libsvm-3.17　快很多。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/1548842.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

debian linux 只安装mysql client

debian linux 只安装mysql client

查询系统版本执行cat /etc/os-release 可以看到是debian11 rootservice-headquarters-hg-self-data-report-844ccf78b-6ls7t:/mysql#cat /etc/os-release PRETTY_NAME"Debian GNU/Linux 11 (bullseye)" NAME"Debian GNU/Linux" VERSION_ID"11&quo…

阅读更多...

DOM元素导出图片与PDF：多种方案对比与实现

DOM元素导出图片与PDF：多种方案对比与实现

背景在日常前端开发中，经常会有把页面的 DOM 元素作为 PNG 或者 PDF 下载到本地的需求。例如海报功能，简历导出功能等等。在我们自家的产品「代码小抄」中，就使用了 html2canvas 来实现代码片段导出为图片： 是不是还行&#xff…

阅读更多...

【STM32】SPI回顾

【STM32】SPI回顾

一、定义 SPI是Motorola首先提出的全双工四线同步串行外围接口，采用主从模式（Master-Slave）架构。二、单机与多机通信 4线SPI器件有四个信号：时钟(SPI CLK, SCLK)、主机输出从机输入(MOSI)、主机输入从机输出(MISO)、片选(CS/N…

阅读更多...

简单理解C++在C的基础上的改变

简单理解C++在C的基础上的改变

1.C语言的一些不足我们首先看下面用C语言实现栈 #include<stdio.h> #include<assert.h> #include<stdlib.h> typedef int StackDateType; typedef struct Stack {StackDateType* _ps;size_t _size;size_t _capacity; }Stack; void StackInit(Stack* ps) {…

阅读更多...

Qt_网络编程

Qt_网络编程

目录 1、Qt的UDP Socket 1.1 用Udp实现服务器 1.2 用Udp实现客户端 2、Qt的TCP Socket 2.1 用Tcp实现服务器 2.2 用Tcp实现客户端 3、Qt的HTTP 3.1使用Qt的HTTP 结语前言： 网络协议是每个平台都必须遵守的，只是不同的平台所提供的网络API不…

阅读更多...

工业缺陷检测——Windows 10本地部署AnomalyGPT工业缺陷检测大模型

工业缺陷检测——Windows 10本地部署AnomalyGPT工业缺陷检测大模型

0. 引言在缺陷检测中，由于真实世界样本中的缺陷数据极为稀少，有时在几千甚至几万个样品中才会出现一个缺陷数据。因此，以往的模型只需在正常样本上进行训练，学习正常样品的数据分布。在测试时，需要手动指定阈值来区分…

阅读更多...

实现语音合成的三种方法：HTML5 Web Speech 、speak-tts、百度语音合成

实现语音合成的三种方法：HTML5 Web Speech 、speak-tts、百度语音合成

1. 使用HTML5 Web Speech API 1.1 使用方法 window.speechSynthesis 是HTML5 Web Speech API的一部分，是浏览器原生提供的文本转语音功能。它允许开发者在网页上通过JavaScript调用，将文本转换为语音进行播放。 https://developer.mozilla.org/zh-CN/d…

阅读更多...

渗透测试--文件上传常用绕过方式

渗透测试--文件上传常用绕过方式

文件上传常用绕过方式 1.前端代码，限制只允许上传图片。修改png为php即可绕过前端校验。 2.后端校验Content-Type 校验文件格式前端修改，抓取上传数据包，并且修改 Content-Type 3.服务端检测（目录路径检测） 对目…

阅读更多...

LMDeploy 量化部署实践

LMDeploy 量化部署实践

任务使用结合W4A16量化与kv cache量化的internlm2_5-1_8b-chat模型封装本地API并与大模型进行一次对话复现过程按照教材安装环境。https://github.com/InternLM/Tutorial/blob/camp3/docs/L2/LMDeploy/readme.md 使用LMDeploy部署原版的1.8b大模型，占用显存2…

阅读更多...

Centos怎么执行脚本

Centos怎么执行脚本

方法一：切换到shell脚本所在的目录（此时，称为工作目录）执行shell脚本 cd /data/shell ./hello.sh 方法二：以绝对路径的方式去执行bash shell脚本 /data/shell/hello.sh 方法三：直接使用bash 或sh 来执行…

阅读更多...

Kubernetes深入详解(一)

Kubernetes深入详解(一)

目录第一部分 K8s概念和架构 1、k8s概述和特性 2、K8s架构组件 3、k8s核心概念第二部分从零搭建k8s集群 1、搭建k8s环境平台规划 2、服务器硬件配置要求 3、搭建k8s集群部署方式 (1) 基于客户端工具kubeadm 1、安装Docker 2、添加阿里云YUM软件源 3、安装kubea…

阅读更多...

代码随想录Day 58|拓扑排序、dijkstra算法精讲，题目:软件构建、参加科学大会

代码随想录Day 58|拓扑排序、dijkstra算法精讲，题目:软件构建、参加科学大会

提示：DDU，供自己复习使用。欢迎大家前来讨论~ 文章目录图论part08**拓扑排序精讲**题目：117. 软件构建拓扑排序的背景解题思路：模拟过程 **dijkstra（朴素版）精讲**题目：47. 参加科学大会解题思…

阅读更多...

腾讯特效 SDK

腾讯特效 SDK

腾讯云视立方腾讯特效 SDK（Tencent Effect）是音视频终端 SDK （腾讯云视立方）的子产品 SDK 之一，提供美颜特效功能。基于优图精准的 AI 能力和天天 P 图丰富的实时特效处理，为各类视频处理场景提供丰富的产品…

阅读更多...

SpringCloud-Netflix第一代微服务快速入门

SpringCloud-Netflix第一代微服务快速入门

1.springCloud常用组件 Netflix Eureka 当我们的微服务过多的时候，管理服务的通信地址是一个非常麻烦的事情，Eureka就是用来管理微服务的通信地址清单的，有了Eureka之后我们通过服务的名字就能实现服务的调用。 Netflix Ribbon\Feign : 客…

阅读更多...

卫星导航定位原理学习（三）

卫星导航定位原理学习（三）

GNSS信号体制及其性能分析 GNSS信号体制直接影响卫星导航系统的性能，是卫星导航系统设计的重要内容。卫星导航信号体制主要包括信号频率、信号结构、导航电文3部分。其中信号结构又包括调制波形、频率带宽、扩频码码长、码速率、码结构、信号功率等内容。导航电文设…

阅读更多...

8086介绍

8086介绍

内部结构执行部件EU（Execution Unit） 包含运算器、通用寄存器组、EU控制单元。只负责控制，不和外部总线打交道总线接口部件BIU（Bus Interface Unit） 包含指令队列缓冲器、16位指令指针寄存器IP、16位段寄存器&am…

阅读更多...

【L波段差分干涉SAR卫星（陆地探测一号01组）】

【L波段差分干涉SAR卫星（陆地探测一号01组）】

L波段差分干涉SAR卫星（陆地探测一号01组） L波段差分干涉SAR卫星（陆地探测一号01组）是我国自主研发的重要卫星系统，以下是对该卫星的详细介绍： 一、基本信息卫星组成：陆地探测一号01组由A星…

阅读更多...

全网最适合入门的面向对象编程教程：53 Python字符串与序列化-字符串与字符编码

全网最适合入门的面向对象编程教程：53 Python字符串与序列化-字符串与字符编码

全网最适合入门的面向对象编程教程：53 Python 字符串与序列化-字符串与字符编码摘要： 在 Python 中，字符串是文本的表示，默认使用 Unicode 编码，这允许你处理各种字符集，字符编码是将字符转换为字节的规则…

阅读更多...

一文上手SpringSecurity【三】

一文上手SpringSecurity【三】

一、认证流程分析上篇文章当中,我们一步一步查阅源码方式对认证流程有了一些认证,本章节梳理一下整个流程,最后形成一张图,以更直观的方式来理解认证的整个流程. 1.1 认证当中步及的接口和类 1.1.1 【抽象类】AbstractAuthenticationProcessingFilter 实现了GenericFilter…

阅读更多...

OFDM通信系统发射端需要做ifftshift的原因分析

OFDM通信系统发射端需要做ifftshift的原因分析

对频率为15Hz的正弦波信号进行FFT分析，并且直接画图，matlab代码如下： fs 100; % sampling frequency t 0:(1/fs):(10-1/fs); % time vector S cos(2*pi*15*t); n length(S); X fft(S); f (0:n-1)*(fs/n); %frequenc…

阅读更多...

最新文章