逻辑回归(中):数学公式学习笔记 LaTeX 版

背景

闲来无事翻了一下之前买的一个机器学习课程及之前记录的网络笔记,发现遇到公式都是截图,甚至是在纸上用笔推导的。重新整理一遍之前逻辑回归函数的学习笔记,主要是为了玩一下 LaTex 语法,写公式挺有意思的。

整理之前三篇笔记汇总如下:

  1. 逻辑回归(上):函数求导过程自推 LaTex 语法
  2. 逻辑回归(中):数学公式学习笔记 LaTeX 版
  3. 逻辑回归(下): Sigmoid 函数的发展历史

逻辑回归数学函数

回顾一下逻辑回归函数:
g ( z ) = 1 1 + e − z g(z)=\frac{1}{1+e^{-z}} g(z)=1+ez1

该函数在学术上被称为 Sigmoid 函数,它的函数曲线图如下:
在这里插入图片描述

逻辑回归和线性回归的关系

逻辑回归和线性回归的关系:对逻辑回归的概率比取自然对数,则得到的是一个线性函数,推导过程如下。

首先,看逻辑回归的函数定义:

g ( z ) = 1 1 + e − z (公式 1 ) g(z)=\frac{1}{1+e^{-z}} (公式1) g(z)=1+ez1(公式1

对于某一个变量 z i z_i zi,可以按照该公式计算出对应的值 g ( z i ) g(z_i) g(zi) 值,要么是 0,要么是1。

其次,变量 z i z_i zi假定它满足线性回归模型,且是具有 N 个独立变量 X i = ( X 1 , X 2... X n ) X_i=(X_1,X2...X_n) Xi=(X1,X2...Xn) 的线性模型。表示为:
z i = w 0 x 0 + w 1 x 1 + . . . + w i x i z_i=w_0x_0+w_1x_1+...+w_ix_i zi=w0x0+w1x1+...+wixi

向量 W = ( w 0 , w 1 , . . . , w n ) W=(w_0,w_1,...,w_n) W=w0,w1,...,wn 代表该线性模型的参数列表。

那么变量 z i z_i zi 就表示为两个向量的乘法,即 W 向量的转置和 X 向量的乘法:
z i = W T X (公式 2 ) z_i=W^TX (公式2) zi=WTX(公式2

第三步,将公式2 代入公式1,则逻辑回归函数就成了:
g ( z i ) = 1 1 + e − W T X (公式 3 ) g(z_i)=\frac{1}{1+e^{-W^TX}} (公式3) g(zi)=1+eWTX1(公式3

第四步,按公式3,计算概率比,因为逻辑回归总体值不超过1,所以某个概率 y 和它的反面 1 − y 1-y 1y 的概率比计算如下:
y 1 − y = 1 1 + e − W T X 1 − 1 1 + e − W T X (公式 4 ) \frac{y}{1-y} = \frac{\frac{1}{1+e^{-W^TX}}}{1-\frac{1}{1+e^{-W^TX}}}(公式4) 1yy=11+eWTX11+eWTX1(公式4

令: A = 1 + e − W T X A=1+e^{-W^TX} A=1+eWTX (公式5)。

A A A 简化公式4:
y 1 − y = 1 A 1 − 1 A = 1 A 1 A ( A − 1 ) = 1 A − 1 (公式 6 ) \frac{y}{1-y} =\frac{\frac{1}{A}}{1-\frac{1}{A}}=\frac{\frac{1}{A}}{\frac{1}{A}(A-1)}=\frac{1}{A-1}(公式6) 1yy=1A1A1=A1(A1)A1=A11(公式6

还原 A 将公式5代入公式6得到概率比:
y 1 − y = 1 1 + e − W T X − 1 = 1 e − W T X = ( e − W T X ) − 1 = e W T X (公式 7 ) \frac{y}{1-y}=\frac{1}{1+e^{-W^{T}X}-1}=\frac{1}{e^{-W^{T}X}}=(e^{-W^{T}X})^{-1}=e^{W^{T}X} (公式7) 1yy=1+eWTX11=eWTX1=(eWTX)1=eWTX(公式7
对该概率比取对数:
l n y 1 − y = l n ( e W T X ) = W T X ln\frac{y}{1-y}=ln(e^{W^{T}X})=W^{T}X ln1yy=ln(eWTX)=WTX

总结:在统计学上, P 1 − P \frac{P}{1-P} 1PP 被称为发生比,即事件发生和不发生的比率,从上面推导的结果可以知道,逻辑回归中的回归是建立在假设事件发生比的对数是线性模型的基础上的。

逻辑回归函数的含义

逻辑回归模型使用了逻辑分布函数,在进行分类时,假设两种满足线性回归模型的不同的分类相互竞争,其中某一方胜出的概率分布在数学上近似为 Sigmoid 曲线,
即 Sigmoid 函数描述了某一方竞争胜出的概率。

以购物为例,假设有特征向量 X i = ( X 1 , X 2... X n ) X_i=(X_1,X2...X_n) Xi=(X1,X2...Xn) ,它们决定了某个顾客 i i i 的购物决定。顾客 i i i 的购物行为记做 y i y_i yi,购物行为分为两种买或者不买。

y i = 1 y_i=1 yi=1,表示顾客 i i i 购买; y i = 0 y_i=0 yi=0 ,则表示顾客 i i i 没有购买。

使用 Sigmoid 的曲线对顾客 i i i 的购物行为【即 y i = 1 y_i=1 yi=1】的概率,表达式为:
P ( y i = 1 ) = 1 1 + e − W i T X i P(y_i=1)=\frac{1}{1+e^{-W_i^{T}X_i}} P(yi=1)=1+eWiTXi1

其中, X i = ( x 1 , x 2 . . . x i . . . x n ) X_i=(x_1,x_2...x_i...x_n) Xi=(x1,x2...xi...xn) 表示顾客 i i i 的特征, W i = ( w 1 , w 2 . . . w i . . . w n ) W_i=(w_1,w_2...w_i...w_n) Wi=(w1,w2...wi...wn) 为模型参数【即事件发生比的对数所对应的线性模型】。

推广到一组顾客,则所有的顾客的购买行为用矩阵表示,就可以写为:
P ( Y = 1 ) = 1 1 + e − W T X P(Y=1)=\frac{1}{1+e^{-W^{T}X}} P(Y=1)=1+eWTX1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1548845.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

机器学习-SVM

线性感知机分类 支持向量机 线性感知机(Perceptron) 感知机是线性二值分类器。 注意:什么是线性?线性分割面就是,就是在分割面中,任意两个的连线也在分割面中,这个分割面,就是线…

debian linux 只安装mysql client

查询系统版本 执行cat /etc/os-release 可以看到是debian11 rootservice-headquarters-hg-self-data-report-844ccf78b-6ls7t:/mysql#cat /etc/os-release PRETTY_NAME"Debian GNU/Linux 11 (bullseye)" NAME"Debian GNU/Linux" VERSION_ID"11&quo…

DOM元素导出图片与PDF:多种方案对比与实现

背景 在日常前端开发中,经常会有把页面的 DOM 元素作为 PNG 或者 PDF 下载到本地的需求。例如海报功能,简历导出功能等等。在我们自家的产品「代码小抄」中,就使用了 html2canvas 来实现代码片段导出为图片: 是不是还行&#xff…

【STM32】SPI回顾

一、定义 SPI是Motorola首先提出的全双工四线同步串行外围接口,采用主从模式(Master-Slave)架构。 二、单机与多机通信 4线SPI器件有四个信号:时钟(SPI CLK, SCLK)、主机输出从机输入(MOSI)、主机输入从机输出(MISO)、片选(CS/N…

简单理解C++在C的基础上的改变

1.C语言的一些不足 我们首先看下面用C语言实现栈 #include<stdio.h> #include<assert.h> #include<stdlib.h> typedef int StackDateType; typedef struct Stack {StackDateType* _ps;size_t _size;size_t _capacity; }Stack; void StackInit(Stack* ps) {…

Qt_网络编程

目录 1、Qt的UDP Socket 1.1 用Udp实现服务器 1.2 用Udp实现客户端 2、Qt的TCP Socket 2.1 用Tcp实现服务器 2.2 用Tcp实现客户端 3、Qt的HTTP 3.1使用Qt的HTTP 结语 前言&#xff1a; 网络协议是每个平台都必须遵守的&#xff0c;只是不同的平台所提供的网络API不…

工业缺陷检测——Windows 10本地部署AnomalyGPT工业缺陷检测大模型

0. 引言 在缺陷检测中&#xff0c;由于真实世界样本中的缺陷数据极为稀少&#xff0c;有时在几千甚至几万个样品中才会出现一个缺陷数据。因此&#xff0c;以往的模型只需在正常样本上进行训练&#xff0c;学习正常样品的数据分布。在测试时&#xff0c;需要手动指定阈值来区分…

实现语音合成的三种方法:HTML5 Web Speech 、speak-tts、百度语音合成

1. 使用HTML5 Web Speech API 1.1 使用方法 window.speechSynthesis 是HTML5 Web Speech API的一部分&#xff0c;是浏览器原生提供的文本转语音功能。它允许开发者在网页上通过JavaScript调用&#xff0c;将文本转换为语音进行播放。 https://developer.mozilla.org/zh-CN/d…

渗透测试--文件上传常用绕过方式

文件上传常用绕过方式 1.前端代码&#xff0c;限制只允许上传图片。修改png为php即可绕过前端校验。 2.后端校验Content-Type 校验文件格式 前端修改&#xff0c;抓取上传数据包&#xff0c;并且修改 Content-Type 3.服务端检测&#xff08;目录路径检测&#xff09; 对目…

LMDeploy 量化部署实践

任务 使用结合W4A16量化与kv cache量化的internlm2_5-1_8b-chat模型封装本地API并与大模型进行一次对话 复现过程 按照教材安装环境。https://github.com/InternLM/Tutorial/blob/camp3/docs/L2/LMDeploy/readme.md 使用LMDeploy部署原版的1.8b大模型&#xff0c;占用显存2…

Centos怎么执行脚本

方法一&#xff1a;切换到shell脚本所在的目录&#xff08;此时&#xff0c;称为工作目录&#xff09;执行shell脚本 cd /data/shell ./hello.sh 方法二&#xff1a;以绝对路径的方式去执行bash shell脚本 /data/shell/hello.sh 方法三&#xff1a;直接使用bash 或sh 来执行…

Kubernetes深入详解(一)

目录 第一部分 K8s概念和架构 1、k8s概述和特性 2、K8s架构组件 3、k8s核心概念 第二部分 从零搭建k8s集群 1、搭建k8s环境平台规划 2、服务器硬件配置要求 3、搭建k8s集群部署方式 (1) 基于客户端工具kubeadm 1、安装Docker 2、添加阿里云YUM软件源 3、安 装kubea…

代码随想录Day 58|拓扑排序、dijkstra算法精讲,题目:软件构建、参加科学大会

提示&#xff1a;DDU&#xff0c;供自己复习使用。欢迎大家前来讨论~ 文章目录 图论part08**拓扑排序精讲**题目&#xff1a;117. 软件构建拓扑排序的背景解题思路&#xff1a;模拟过程 **dijkstra&#xff08;朴素版&#xff09;精讲**题目&#xff1a;47. 参加科学大会解题思…

腾讯特效 SDK

腾讯云视立方腾讯特效 SDK&#xff08;Tencent Effect&#xff09;是音视频终端 SDK &#xff08;腾讯云视立方&#xff09;的子产品 SDK 之一&#xff0c;提供美颜特效功能。基于优图精准的 AI 能力和天天 P 图丰富的实时特效处理&#xff0c;为各类视频处理场景提供丰富的产品…

SpringCloud-Netflix第一代微服务快速入门

1.springCloud常用组件 Netflix Eureka 当我们的微服务过多的时候&#xff0c;管理服务的通信地址是一个非常麻烦的事情&#xff0c;Eureka就是用来管理微服务的通信地址清单的&#xff0c;有了Eureka之后我们通过服务的名字就能实现服务的调用。 Netflix Ribbon\Feign : 客…

卫星导航定位原理学习(三)

GNSS信号体制及其性能分析 GNSS信号体制直接影响卫星导航系统的性能&#xff0c;是卫星导航系统设计的重要内容。卫星导航信号体制主要包括信号频率、信号结构、导航电文3部分。其中信号结构又包括调制波形、频率带宽、扩频码码长、码速率、码结构、信号功率等内容。导航电文设…

8086介绍

内部结构 执行部件EU&#xff08;Execution Unit&#xff09; 包含运算器、通用寄存器组、EU控制单元。 只负责控制&#xff0c;不和外部总线打交道 总线接口部件BIU&#xff08;Bus Interface Unit&#xff09; 包含指令队列缓冲器、16位指令指针寄存器IP、16位段寄存器&am…

【L波段差分干涉SAR卫星(陆地探测一号01组)】

L波段差分干涉SAR卫星&#xff08;陆地探测一号01组&#xff09; L波段差分干涉SAR卫星&#xff08;陆地探测一号01组&#xff09;是我国自主研发的重要卫星系统&#xff0c;以下是对该卫星的详细介绍&#xff1a; 一、基本信息 卫星组成&#xff1a;陆地探测一号01组由A星…

全网最适合入门的面向对象编程教程:53 Python字符串与序列化-字符串与字符编码

全网最适合入门的面向对象编程教程&#xff1a;53 Python 字符串与序列化-字符串与字符编码 摘要&#xff1a; 在 Python 中&#xff0c;字符串是文本的表示&#xff0c;默认使用 Unicode 编码&#xff0c;这允许你处理各种字符集&#xff0c;字符编码是将字符转换为字节的规则…

一文上手SpringSecurity【三】

一、认证流程分析 上篇文章当中,我们一步一步查阅源码方式对认证流程有了一些认证,本章节梳理一下整个流程,最后形成一张图,以更直观的方式来理解认证的整个流程. 1.1 认证当中步及的接口和类 1.1.1 【抽象类】AbstractAuthenticationProcessingFilter 实现了GenericFilter…