ML 系列:第 18 部 - 高级概率论:条件概率、随机变量和概率分布

文章目录

  • 一、说明
  • 二、关于条件概率
    • 2.1 为什么我们说条件概率?
    • 2.2 为什么条件概率在统计学中很重要
  • 三、 随机变量的定义
    • 3.1 定义
    • 3.2 条件概率中的随机变量
  • 四、概率分布的定义
  • 五、结论

一、说明

条件概率是极其重要的概率概念,它是因果关系的数学表述,也是随机过程的主要核心内容。本文将就条件概率的相关概念进行叙述。

二、关于条件概率

碳条件概率是假设另一事件已经发生,则某事件发生的概率。当两个或多个事件不独立时,使用条件概率。这意味着 一个事件发生的可能性受到另一个事件是否发生的影响。

从数学上讲,条件概率用𝑃(𝐵∣𝐴) 表示,即“在事件 A 发生的情况下,事件 B 发生的概率”。它问道:“如果我们知道 A 已经发生,那么 B 发生的概率是多少?”
在这里插入图片描述
图 1.条件概率公式

2.1 为什么我们说条件概率?

我们使用“条件概率”一词,因为它表示在另一事件已经发生的条件下发生某事件的概率。换句话说,它量化了在我们有关于另一事件发生的额外信息的情况下发生某事件的可能性。
在这里插入图片描述

图 2.条件概率项

2.2 为什么条件概率在统计学中很重要

条件概率在统计学中至关重要,因为它可以帮助我们根据已知的信息调整预测。当我们已经知道事件 A 已经发生时,它告诉我们事件 B 发生的可能性。

三、 随机变量的定义

3.1 定义

随机变量是将实数与事件相关联的函数。这意味着为每个可能的结果分配一个值(一个实数)。用更数学的术语来说,它是从样本空间 Ω 到实数的函数。我们可以根据需要选择随机变量。

在这里插入图片描述

图 3.随机变量

3.2 条件概率中的随机变量

它为随机实验的样本空间中的每个结果分配一个数值,从而更容易处理和分析这些结果的概率属性。

在这里插入图片描述

图 4.硬币的随机变量
如果硬币正面朝上,则随机变量 X 的值为 1;如果硬币反面朝上,则随机变量 X 的值为 0。在一次抛硬币中,出现这两种情况的概率均为 50%。X(在本例中为 1 和 0)可以取的值称为样本空间,可以表示为 {0, 1}。

处理随机变量时,我们经常使用符号𝑃(𝐵=𝑏∣𝐴=𝑎)。

每个部分的含义如下:

𝐴 和 𝐵 是随机变量,a和b是这些随机变量可以取的特定值。𝑃(𝐵=𝑏∣𝐴=𝑎) 的含义:
该符号表示在随机变量 𝐴 取值a的情况下,随机变量 𝐵 取值b的概率。简单来说,它描述了了解 𝐴 的结果如何影响 𝐵 结果的可能性。

例子
假设某人掷出两个公平的六面骰子,并且我们希望计算第一个骰子的正面值为 2 的概率,前提是它们的总和不大于 5。

令D 1 为骰子 1 掷出的值。
令D 2 为骰子 2 掷出的值。
D 1 = 2的概率
在这里插入图片描述

图 5. D 1 = 2的概率
表 1 显示了两个骰子掷出的 36 种组合的样本空间,每种组合出现的概率为 1/36,红色和深灰色单元格中显示的数字为D 1 + D 2 (D = D1+D2 = 36)。注意:表 1 中的每个单元格代表 D1 和 D2(两个骰子的结果)的总和

在 36 个结果中,恰好有 6 个结果为D 1 = 2;因此P ( D 1 = 2) = 6/36 = 1/6

  1. D 1 + D 2 ≤5的概率

在这里插入图片描述

图 6. D 1 + D 2 ≤5的概率
我们有 36 种结果,但只有 10 种可能性小于 5,换句话说,结果是 10 / 36

  1. 假设D 1 + D 2 ≤ 5 ,则D 1 = 2的概率

这是一个有趣的例子,在这个例子中,条件概率发挥了作用。

在这里插入图片描述

图 7.假设D 1 + D 2 ≤ 5 ,则D 1 = 2的概率
表 3 显示,对于这 10 个结果中的 3 个(D 1+ D 2 ≤5),D 1 = 2。因此,条件概率 P( D 1 = 2 | D 1+ D 2 ≤5) = 3/10 = 0.3

让我们尝试了解其背后的数学原理:

B:D1=2
答:D1 + D2≤5
P( B | A ) = P(B∩A)/P(A) = (3/36)/(10/36) = 3/10是多少
所以我们可以说P( B | A ) = P(B ∩ A) / P(A);如果 P(A) ≠0

探索不同类型的随机变量:离散和连续
随机变量可分为两种主要类型:离散型和连续型。了解这两种类型之间的差异对于选择合适的统计方法和模型至关重要。
在这里插入图片描述

图 8.离散和连续随机变量

1.离散随机变量
离散随机变量具有可数的不同值。这些值通常是整数,随机变量通常来自可以计算结果的场景。示例包括一系列抛硬币中正面朝上的次数、一小时内通过收费站的汽车数量或教室里的学生人数。

在这里插入图片描述

图 9.离散随机变量
**主要特点:**

可数结果:离散随机变量具有有限或可数无限的可能值集。
2.连续随机变量
连续随机变量在给定间隔内具有无数个值。这些值通常是测量值,可以取一定范围内的任何值。示例包括班级学生的身高、完成任务所需的时间或城市的温度。

主要特点:

不可数结果:连续随机变量可以在区间内取任意值,使得其可能值集不可数。

四、概率分布的定义

随机变量 (X) 的概率分布显示事件概率在随机变量的不同值上的分布情况。当随机变量的所有值在图形上排列时,其概率值会形成一个形状。概率分布具有几个可以测量的属性(例如:期望值和方差)。应该记住,有利结果的概率始终大于零,所有事件的所有概率之和等于 1。

概率分布本质上是任何随机实验或事件的所有可能结果的集合。

概率分布在理解随机变量中的作用
概率分布表征随机变量可能取的值,并为这些值分配概率。这些分布是统计学中的基本概念,描述随机变量的值如何分布。根据随机变量是可数的还是不可数的,概率分布可以分别是离散的或连续的。

离散概率分布:处理离散随机变量(例如,硬币翻转的正面次数)并由概率质量函数(PMF)定义。
连续概率分布:处理连续随机变量(例如,人的身高)并由概率密度函数定义(PDF)。
在这里插入图片描述

图 10.概率分布

五、结论

我们的 ML 系列第 18 天深入探讨了条件概率、随机变量和概率分布,这些都是理解概率论的重要概念。在第 19 天 — PMF、PDF、均值、方差、标准差中,我们将通过探索概率质量函数 (PMF)、概率密度函数 (PDF)和深入研究著名的概率分布来进一步简化。请继续关注我们,我们将继续探索概率世界及其在机器学习及其他领域的应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1613.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Spring @RequestMapping 注解

文章目录 Spring RequestMapping 注解一、引言二、RequestMapping注解基础1、基本用法2、处理多个URI 三、高级用法1、处理HTTP方法2、参数和消息头处理 四、总结 Spring RequestMapping 注解 一、引言 在Spring框架中,RequestMapping 注解是构建Web应用程序时不可…

Nginx简单安装

nginx(“engine x”)是一个具有高性能的 http 和反向代理 的 web服务器,同时也是个 POP3/SMTP/IMAP代理服务器。 web服务器:也叫网页服务器,WebServer ,主要功能是为用户提供网上信息浏览服务。 http&am…

硅谷甄选(七)属性管理模块

属性管理模块 6.1 属性管理模块的静态组件 属性管理分为上面部分的三级分类模块以及下面的添加属性部分。我们将三级分类模块单独提取出来做成全局组件 6.1.1 三级分类全局组件&#xff08;静态&#xff09; 注意&#xff1a;要在src\components\index.ts下引入。 <temp…

完美日记营销模式对开源 AI 智能名片 2 + 1 链动模式 S2B2C 商城小程序的启示

摘要&#xff1a;本文通过分析完美日记在营销中利用社会基础设施升级红利、网红与新流量平台、KOL 和私域流量等策略取得成功的案例&#xff0c;探讨其对开源 AI 智能名片 2 1 链动模式 S2B2C 商城小程序在营销推广、用户获取与留存、提升复购率等方面的启示&#xff0c;为商城…

【Hive sql 面试题】统计Top3歌单以及每个Top3歌单下的Top3歌曲(难)

表数据如下&#xff1a; 1 1 经典老歌 1 月亮代表我的心 2 1 经典老歌 1 月亮代表我的心 3 1 经典老歌 3 夜来香 4 1 经典老歌 4 我只在乎你 5 1 经典老歌 5 千言万语 6 1 经典老歌 5 千言万语 7 2 流行金曲 7 突然好想你 8 2 流行金曲 8 后来 9 2 流行金曲 9 童话 10 2 流行金…

深入剖析卷积神经网络中的卷积核

深入剖析卷积神经网络中的卷积核 前言一、卷积核的数学基础代码示例&#xff1a;简单的2D卷积操作 二、卷积核的类型与作用1. 边缘检测卷积核代码示例&#xff1a;Sobel算子 2. 模糊与平滑卷积核代码示例&#xff1a;高斯滤波器 三、卷积核的实际应用四、卷积核的初始化与学习五…

【GIT】-git常见指令

概念 远程仓库和本地仓库 常用指令&#xff1a; ls/ll查看当前目录cat查看文件内容touch创建文件vivi编辑器 备注&#xff1a; git GUI&#xff1a;是git提供的图形化工具 GIT Bash&#xff1a;Git提供的命令行工具 在安装GIT后要配置用户和账号&#xff01; 配置用户信息 …

高效实现聚水潭·奇门售后数据集成MySQL案例详解

聚水潭奇门数据集成到MySQL的技术案例分享 在现代企业的数据管理中&#xff0c;如何高效、准确地实现不同系统之间的数据对接和集成是一个关键问题。本文将聚焦于一个具体的系统对接集成案例&#xff1a;将聚水潭奇门平台的售后单数据集成到MySQL数据库中&#xff0c;方案名称…

软件测试八股文个人总结

&#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 前面看到了一些面试题&#xff0c;总感觉会用得到&#xff0c;但是看一遍又记不住&#xff0c;所以我把面试题都整合在一起&#xff0c;都是来自各路大佬的分享&am…

python读取视频并转换成gif图片

1. 安装三方库 moviepy 将视频转换成gif&#xff0c;需要使用 moviepy库 确保已经安装了moviepy库 pip install moviepy2. 代码实现&#xff1a; from moviepy.editor import VideoFileClipmyclip VideoFileClip("video.mp4") myclip2 myclip.subclip(0, 10).re…

k8s部署redis远程连接示例

一、环境 节点 IP 服务 master 192.168.126.46 docker、kubeadm、kubelet、kubectl、flannel、telnet node1 192.168.126.47 docker、kubeadm、kubelet、kubectl、flannel、telnet node2 192.168.126.48 docker、kubeadm、kubelet、kubectl、flannel、telnet ubunt…

UI自动化测试 —— CSS元素定位实践!

前言 自动化测试元素定位是指在自动化测试过程中&#xff0c;通过特定的方法或策略来准确识别和定位页面上的元素&#xff0c;以便对这些元素进行进一步的操作或断言。这些元素可以是文本框、按钮、链接、图片等HTML页面上的任何可见或不可见的组件。 在自动化测试中&#xf…

【含开通报告+文档+源码】基于SpringBoot的新能源充电桩管理系统的设计与实现

开题报告 近年来&#xff0c;随着全球对环境问题的关注和新能源汽车的普及&#xff0c;新能源充电桩的需求显著增加[1]。为了满足大量新能源车辆的充电需求&#xff0c;各地纷纷建设新能源充电桩站点。然而&#xff0c;随着充电桩数量的增加&#xff0c;管理和运营充电桩也面临…

Unity引擎材质球残留贴图引用的处理

大家好&#xff0c;我是阿赵。   这次来分享一下Unity引擎材质球残留贴图引用的处理 一、 问题 在使用Unity调整美术效果的时候&#xff0c;我们很经常会有这样的操作&#xff0c;比如&#xff1a; 1、 同一个材质球切换不同的Shader、 比如我现在有2个Shader&#xff0c;…

一行代码实现垂直居中

实现元素垂直居中的方案有很多&#xff0c;比如定位、伸缩盒子、行高等等。 但在 2024 年的Chrome 123 版本中&#xff0c; CSS 原生可以使用 1 个 CSS 属性 align-content: center进行垂直居中。 如何使用 <!DOCTYPE html> <html lang"en"> <head&…

云计算作业一

目录 0. 前置准备 0.1 安装虚拟机 0.2 Linux统一设置 1. Hadoop安装配置 1.1 环境准备 1.2 Hadoop伪分布式安装 1.3 Hadoop集群安装 2. HDFS实验&#xff0c;包括Shell命令操作和Java接口访问 2.1 HDFS操作命令 2.2 通过Java项目访问HDFS 2.3 使用winutils解决警告信…

C# 结构型设计模式----适配器模式

1、简介 简单的说就是将一个类的接口转换成客户希望的另一个接口。 举例理解: 你买了一个苹果手机&#xff0c;但是家里的数据线都是安卓的&#xff0c;你想用安卓的线充你的苹果手机&#xff0c;那你就需要一个转接头。适配器模式就是适用于这种情况。 适配的本质就是转换…

感受野是什么?有什么用?从感受野的角度理解,FCN要堆叠卷积层

参考&#xff1a;感受野 1.感受野是什么 感受野(receptive field)这一概念来自于生物神经科学&#xff0c;是指感觉系统中的任一神经元&#xff0c;其所受到的感受器神经元的支配范围。感受器神经元就是指接收感觉信号的最初级神经元。 而在卷积神经网络中&#xff0c;感受野…

C++基础三(构造函数,形参默认值,函数重载,单例模式,析构函数,内联函数,拷贝构造函数)

C有六个默认函数&#xff0c;分别是&#xff1a; 1、默认构造函数; 2、默认拷贝构造函数; 3、默认析构函数; 4、赋值运算符; 5、取址运算符; 6、取址运算符const; 构造函数 构造函数(初始化类成员变量)&#xff1a; 1、属于类的成员函数之一 …

LEADTOOLS 版本 23 现已发布,引入了 Excel API等众多新功能!

LEADTOOLS 以其在全世界主要国家中占有的市场领导地位&#xff0c;在数码图象开发工具领域中已成为既定的全球领导者&#xff0c;其不断发展和扩展功能&#xff0c;以帮助开发人员构建更好、更强大的应用程序。最新发布的 LEADTOOLS 版本 23引入了许多新功能&#xff0c;包括新…