概率分布深度解析:PMF、PDF和CDF的技术指南

本文将深入探讨概率分布,详细阐述概率质量函数(PMF)、概率密度函数(PDF)和累积分布函数(CDF)这些核心概念,并通过实际示例进行说明。

在深入探讨PMF、PDF和CDF之前,有必要先简要介绍两种常用的概率分布:正态分布和均匀分布。

正态分布: 也称为高斯分布或钟形曲线,正态分布以其均值为中心对称。它广泛应用于描述自然界中的许多现象。诸如人口身高、标准化考试成绩、测量误差等多种实际数据集都呈现正态分布特征。

均匀分布: 在均匀分布中,给定范围内的每个结果具有相等的概率。这是最基本的概率分布形式,常用于描述每个结果等可能出现的情况,如公平骰子的投掷结果或0到1之间随机数的选取。

图1左侧展示了正态分布,呈现典型的钟形曲线,以平均值(此处为0)为中心。可以观察到,大多数数值集中在中心区域。右侧图表表示均匀分布,在0到1之间呈现均匀分布,表明每个值具有相等的出现概率。

在数据科学和统计学研究中,理解概率分布方式是核心任务。概率分布函数在这方面发挥着关键作用。本文将详细讨论概率密度函数(PDF)、**概率质量函数(PMF)累积分布函数(CDF)**的概念。我们还将探讨如何从PMF或PDF推导CDF,并为每种情况提供具体示例。

概率质量函数(PMF)

概率质量函数(PMF)专用于描述离散随机变量。它定义了离散随机变量取特定值的概率。PMF为表示不同离散结果的概率提供了一种方法。

例如,在硬币翻转实验中,可能的结果只有正面和反面两种。公平硬币翻转的PMF可以表示为:

P(正面) = 0.5P(反面) = 0.5

另一个典型示例是投掷六面骰子。PMF表明每个结果(1,2,3,4,5,6)的概率均为0.167(约等于1/6)。

概率密度函数(PDF)

概率密度函数(PDF)用于描述连续随机变量。与为离散值分配概率的PMF不同,PDF描述了随机变量落在特定范围内的可能性。在连续分布中,任一具体点的概率为零,但我们可以通过对PDF在某个区间上进行积分来计算变量落在该区间内的概率。

正态分布(也称为高斯分布)是最常用的连续概率分布之一。其PDF可以表示为:

PDF给出了连续随机变量不同值的相对可能性。

下图直观地展示了PDF和PMF。左图显示了PDF的钟形曲线,曲线下的面积代表连续变量的概率。曲线的峰值位于均值处,其展开程度由标准差决定。右图展示了PMF(以六面骰子投掷为例),表示离散结果,每个可能的结果具有相等的概率。PMF为每个可能的结果分配了具体的概率值。

图3:概率密度函数(左)和概率质量函数(右)的图形表示。

累积分布函数(CDF)

累积分布函数(CDF)是一个函数,它定义了随机变量 X 小于或等于特定值 x 的概率。在数学上CDF 定义为:

F(x) = P(X ≤ x)

CDF 可以理解为概率的"累积和"。它从 0 开始,随着随机变量值的增加而增加,最终达到 1(表示总概率)。

为了更好地理解这些概念,我们将通过两个实例来说明,这些实例与前面解释 PDF 和 PMF 时使用的例子相对应:

示例1:离散随机变量的 CDF(骰子投掷)

考虑投掷一个标准六面骰子的情况。可能的结果是 {1,2,3,4,5,6},每个结果的概率均为 0.167(约等于 1/6)。

我们可以通过累加每个结果的概率来构建 CDF:

当 x = 1 时:P(X ≤ 1) 是结果小于或等于 1 的概率。F(1) = P(X = 1) = 0.167

当 x = 2 时:P(X ≤ 2) 是结果小于或等于 2 的概率。F(2) = P(X ≤ 2) = P(X = 1) + P(X = 2) = 0.167 + 0.167 = 0.333

依此类推,当 x = 6 时,CDF 包括了所有可能的结果(因为骰子不可能产生大于 6 的结果),因此总概率为 1。F(6) = P(X ≤ 6) = P(X = 1) + P(X = 2) + … + P(X = 6) = 1

由此可见CDF 是逐步增加的,累积了每个结果的概率。如果我们绘制这个函数,会得到一个阶梯状的图形,这是离散变量 CDF 的典型特征。

示例2:连续随机变量的 CDF(均匀分布)

现在让我们考虑一个连续变量的情况。假设 X 遵循 0 到 1 之间的均匀分布。均匀分布的 PDF 在区间 [0,1] 内为常数 1,在其他区间为 0。

我们可以通过对 PDF 进行积分来计算 CDF。

对于 x = 0.2,CDF 就是从 0 到 0.2 的 PDF 下的面积。我们对 PDF 在区间 [0, 0.2] 上积分,得到结果 0.2。

对于 x = 1,我们对 PDF 在区间 [0, 1] 上积分,CDF 的值为 1。

由于这是均匀分布,CDF 从 0 线性增加到 1。如果我们绘制这个函数,如下图所示会得到一条从点 (0, 0) 到点 (1, 1) 的直线,反映了 0 和 1 之间所有值具有相等概率的特性。

图4:左图显示了离散随机变量(骰子投掷)的 CDF,展示了骰子投掷结果概率的阶梯式累积。右图是连续随机变量(均匀分布)的 CDF,显示了从 0 到 1 的连续均匀分布概率的平滑线性增加。

结论

累积分布函数(CDF)是理解离散和连续设置中概率分布的强大工具。它使我们能够直观地看到任何给定点之前的累积概率,特别适用于计算区间概率。这些概念在数据分析、统计推断和机器学习算法中有广泛的应用。对于那些正在学习数据科学和统计学的读者,深入理解这些基本概念将为更高级的主题奠定坚实的基础。

https://avoid.overfit.cn/post/4571cfdbae7b43b2b6db94769f433d66

作者:Uzmasherali

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1537394.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

JavaSE - 面向对象编程03

01 多态 01_01 认识多态 01_02 多态的好处和缺点 【1】好处:① 可以解耦合,扩展性更强,父类引用指向的子类对象可以随时切换,而后面的逻辑 代码并不需要更改。 ② 使用父类引用可以作为方法的形参或返…

java138-异常处理_java 138错误

//异常 public class test79 { //定义方法声明定义异常,在满足条件时抛出异常对象,程序转向异常处理 public double count(double n,double m)throws Exception { if (m 0) {//如果除数等于0.则抛出异常实例 throw new Ex…

C/C++:优选算法(持续更新~~)

一、双指针 1.1移动零 链接:283. 移动零 - 力扣(LeetCode) 给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。请注意 ,必须在不复制数组的情况下原地对数组进行操…

近期值得关注的扩散模型Diffusion与时间序列结合的文章

扩散模型 扩散模型(diffusion model)是一类生成模型,运用了物理热力学扩散思想,主要用于对复杂数据分布进行建模和采样。以图片生成举例简要介绍下扩散模型运作方法。给定目标分布q(x)中的一些观测数据x,生成模型的目…

常见算法——自相关的含义及Python、C实现

常见算法——自相关的含义及C实现 一、概念1. 自相关概念2. 滞后期示例说明: 二、自相关的计算步骤:1. 确定滞后期 (Lag):2. 计算平均值:3. 计算自相关: 三、示例 Python自相关计算1. 代码2. 运行结果 四、C语言实现自…

剖解杨辉三角

杨辉三角 思路&#xff1a; 我们将上述转换为一个二维数组&#xff0c;即可实现效果 另外在实现代码之前我们要了解Java中是如何实现二维数组的&#xff1a; 实现代码如下&#xff1a; public List<List<Integer>> generate(int numRows){List<List<Integ…

【linux-Day3】linux的基本指令<中>

【linux-Day3】linux的基本指令<中> linux下的基本指令&#x1f4e2;man&#xff1a;访问linux手册页&#x1f4e2;echo&#xff1a;把字符串写入指定文件中&#x1f4e2;cat&#xff1a;查看目标文件的内容&#x1f4e2;cp&#xff1a;复制文件或目录&#x1f4e2;mv&am…

【Go】Go语言中延迟函数、函数数据的类型、匿名函数、闭包等高阶函数用法与应用实战

✨✨ 欢迎大家来到景天科技苑✨✨ &#x1f388;&#x1f388; 养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; &#x1f3c6; 作者简介&#xff1a;景天科技苑 &#x1f3c6;《头衔》&#xff1a;大厂架构师&#xff0c;华为云开发者社区专家博主&#xff0c;…

通信工程学习:什么是EPON以太网无源光网络

EPON&#xff1a;以太网无源光网络 EPON&#xff08;Ethernet Passive Optical Network&#xff0c;以太网无源光网络&#xff09;是一种结合了以太网技术和无源光网络&#xff08;PON&#xff09;优势的高速、大容量宽带接入技术。以下是关于EPON的详细解释&#xff1a; 一、…

springboot Controller层返回的结果,日志添加traceId ,方便对日志的追踪查询

要解决的问题&#xff1f; 接口报错&#xff0c;如何快速定位问题&#xff1f;这个需要日志的辅助&#xff0c;一般错误日志中有详细的堆栈信息&#xff0c;具体是哪行代码报错&#xff0c;都可以看到。 要想快速定位问题&#xff0c;前提是要能够快速定位日志。 海量日志&am…

GPU加速生物信息分析的尝试

GPU工具分类 实话实说&#xff0c;暂时只有英伟达的GPU才能实现比较方便的基因组分析集成化解决方案&#xff0c;其他卡还需要努力呀&#xff0c;或者需要商业公司或学术团体的努力开发呀&#xff01;FPGA等这种专用卡的解决方案也是有的&#xff0c;比如某测序仪厂家&#xf…

Leetcode—815. 公交路线【困难】(unordered_map+queue)

2024每日刷题&#xff08;163&#xff09; Leetcode—815. 公交路线 bfs实现代码 class Solution { public:int numBusesToDestination(vector<vector<int>>& routes, int source, int target) {if(source target) {return 0;}unordered_map<int, vector…

ROS组合导航笔记1:融合传感器数据

使用机器人定位包&#xff08;robot_localization package&#xff09;来合并来自不同传感器的数据&#xff0c;以改进机器人定位时的姿态估计。 基本概念 在现实生活中操作机器人时&#xff0c;有时我们需要处理不够准确的传感器数据。如果我们想要实现机器人的高精度定位&am…

Jemter项目实战(黑马程序员)

视频网址&#xff1a;02测试数据准备_哔哩哔哩_bilibili 自动化脚本架构搭建 新增和修改 新增 删除和查询 弱压力、高并发、高频率 弱压力测试 高并发 高频率 生成图形化报告

记忆化搜索算法专题——算法简介力扣实战应用

目录 1、记忆化搜索算法简介 1.1 什么是记忆化搜索 1.2 如何实现记忆化搜索 1.3 记忆化搜索与动态规划的区别 2、算法应用【leetcode】 2.1 题一&#xff1a;斐波那契数 2.1.1 递归暴搜解法代码 2.1.2 记忆化搜索解法代码 2.1.3 动态规划解法代码 2.2 题二&#xff1…

JavaScript高级——闭包的作用

1、使用函数内部的变量在函数执行完后&#xff0c;仍然存活在内存中&#xff08;延长了局部变量的生命周期&#xff09; 2、让函数外部可以操作&#xff08;读写&#xff09;到函数内部的数据&#xff08;变量/函数&#xff09; 3、函数执行完后&#xff0c;函数内部声明的局…

【1.使用Index和Match函数自动补全内容】

目录 前言如何利用函数自动填充内容效果学会使用的方法(文字图片版本)只管使用&#xff0c;不看原理原理解读MATCH函数INDEX函数组合 学会使用的方法(视频版本) 后言最后想说的话 前言 如何利用函数自动填充内容 先说结论&#xff0c;本文的目的是通过使用Excel的函数&#xf…

31.递归、搜索、回溯之综合练习

1.找出所有子集的异或总和再求和&#xff08;easy&#xff09; . - 力扣&#xff08;LeetCode&#xff09; 题目解析 算法原理 代码 class Solution {int path;int sum;public int subsetXORSum(int[] nums) {dfs(nums, 0);return sum;}public void dfs(int[] nums, int pos…

Vue(12)——路由的基本使用

VueRouter 作用&#xff1a;修改地址栏路径时&#xff0c;切换显示匹配的组件 基本步骤&#xff08;固定&#xff09; 下载&#xff1a;下载VueRouter模块到当前工程引入安装注册创建路由对象注入&#xff0c;将路由对象注入到new Vue 实例中&#xff0c;建立关联 发现了#/表…

『功能项目』事件中心处理怪物死亡【55】

我们打开上一篇54回调函数处理死亡的项目&#xff0c; 本章要做的事情是用事件中心处理怪物死亡后的逻辑 首先打开之前事件中心脚本&#xff08;不做更改&#xff0c;调用即可&#xff09;&#xff1a; using System.Collections.Generic; using UnityEngine.Events; //中介者…