ML 系列: 第 24 节 — 离散概率分布(泊松分布)

目录

一、说明

二、固定时间间隔示例

三、固定间隔的示例

四、泊松分布的主要特征

五、示例

5.1 平均客户数的计算:

5.2 用于计算和绘制泊松分布的 Python 代码:


一、说明

        泊松概率分布是一种离散概率分布,它表示在固定的时间或空间间隔内发生给定数量的事件的概率,前提是这些事件以已知的恒定平均速率发生,并且与自上次事件以来的时间无关。此分布对于对罕见事件进行建模特别有用。

泊松分布以生活在 58 年(1781-1840 年)的西蒙·丹尼斯·泊松男爵的名字命名。泊松是一位法国数学家和物理学家,以其在各个领域的广泛贡献而闻名,包括统计学、复分析、偏微分方程、变分微积分、分析力学、电和磁学、热力学、弹性和流体力学。

: 固定的时间或空间间隔是指观察或测量事件的特定、不变的时间段或区域。以下是两者的示例:

二、固定时间间隔示例

  • Number of Emails Received per hour (每小时接收的电子邮件数量):假设您要对客户服务部门在一小时内收到的电子邮件数量进行建模。此处,固定时间间隔为 1 小时。如果该部门平均每小时收到 10 封电子邮件,则泊松分布可用于预测在任何给定小时内收到不同数量电子邮件的概率。

三、固定间隔的示例

  • 一公顷森林中的树木数量:假设您正在研究森林中特定树种的分布。您可能想知道在一公顷的土地上找到一定数量的这些树的概率。在这里,固定的空间间隔是 1 公顷。如果每公顷的平均树木数为 50,则泊松分布可以帮助对在任何给定公顷内找到不同数量的树木的可能性进行建模。

四、泊松分布的主要特征

  1. 参数:泊松分布由单个参数 λ (lambda) 定义,该参数表示指定区间内的平均事件数
  2. 概率质量函数:在给定区间内观察到 k 个事件的概率计算如下:

其中 k 是非负整数 (0, 1, 2, ...),e 是自然对数的底数(约为 2.71828)。

3. 均值和方差:在泊松分布中,均值和方差都等于 λ

五、示例

        假设我们有兴趣对早高峰时段每 10 分钟到达咖啡店的顾客数量进行建模。根据历史数据,我们观察到以下内容:

        在此示例中,我们观察到了在三个 10 分钟间隔内到达的客户数量。此数据为我们提供了对每个间隔的平均客户数的见解。

5.1 平均客户数的计算:

        为了找到每 10 分钟间隔的平均客户数 (λ),我们将每个间隔中观察到的客户数相加,然后除以间隔数:

  • 客户总数 = 3 + 7 + 4 = 14
  • 间隔数 = 3
  • 每个区间的平均客户数 = 14/3 ≈ 4.67

10:30 AM 到 10:40 AM 间隔的预测:

为了预测上午 10:30 到上午 10:40 间隔的客户数量,我们将使用每 10 分钟间隔的平均客户数量,我们计算得出的顾客数量约为 4.67

对于在上午 10:30 到 10:40 之间到达的每个可能数量的客户 k,我们将使用泊松分布公式:

这里:

  • k 是到达的客户数量 (0, 1, 2, ...)
  • λ 是每 10 分钟间隔的平均客户到达率(约为 4.67)
  • e 是自然对数的底数(约为 2.71828)。

5.2 用于计算和绘制泊松分布的 Python 代码:

import numpy as np
import matplotlib.pyplot as plt
import math# Define the rate parameter (lambda) for the Poisson distribution
lambda_ = 4.67# Define the range of possible number of customers (from 0 to 10)
x = np.arange(0, 11)# Calculate the probability mass function (PMF) for each number of customers
pmf = [math.exp(-lambda_) * (lambda_ ** k) / math.factorial(k) for k in x]# Plotting the Poisson distribution
plt.figure(figsize=(10, 6))
plt.bar(x, pmf, color='skyblue', edgecolor='black')
plt.title('Poisson Distribution: Number of Customers Arriving Between 10:30 AM and 10:40 AM')
plt.xlabel('Number of Customers')
plt.ylabel('Probability')
plt.xticks(x)
plt.grid(True, linestyle='--', alpha=0.7)
plt.show()

这是上面的代码输出:

        在 ML 系列的第 24 天,我们深入研究了泊松分布,而第 20 天到第 24 天则专门探索了各种著名的离散分布。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/13875.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【comfyui教程】如何用 ComfyUI 修复和上色老照片?详细教程让老照片焕发新生

前言 如何用 ComfyUI 修复和上色老照片?详细教程让老照片焕发新生 老照片承载着无数回忆,可时光不饶人,随着岁月流逝,它们渐渐变得模糊、泛黄,甚至出现了褪色、裂痕。对于想要留住这份珍贵记忆的人来说,修…

ThinkServer SR658H V2服务器BMC做raid与装系统

目录 前提准备 一. 给磁盘做raid 二. 安装系统 前提准备 磁盘和系统BMC地址都已经准备好,可正常使用。 例: 设备BMC地址:10.99.240.196 一. 给磁盘做raid 要求: 1. 将两个894G的磁盘做成raid1 2. 将两块14902G的磁盘各自做…

BUUCTF pwn2_sctf_2016 int 0x80方法

本文目的 BUUCTF的PWN的第一页的pwn2_sctf_2016的libc不适用辣,但网上一搜全是libc 然后怎么办嘞,都明摆着有个int 0x80,当然是用啊 所以水一篇 早上中午晚上好 老三样,下载程序,打开ida,拖进去 一眼好几…

如何构建一个功能强大的低代码平台网站?关键步骤与技巧全解析

随着数字化转型的加速,企业对敏捷开发和快速迭代的需求越来越迫切。低代码平台应运而生,成为连接业务需求和技术实现的重要桥梁。低代码平台不仅能够大幅降低技术门槛,还能够通过可视化界面和预配置组件简化开发流程,帮助企业快速…

Unity图形学之Shader2.0 模板测试

1.模版测试:符合条件的 通过 不符合条件的 像素 丢弃 比较公式: if((referenceValue&readMask) comparisonFunction (stencilBufferValue&readMask)) 通过像素 else 抛弃…

RK3588 快速上手

1、资料介绍 我的开发板是临滴科技的LKD3588,相关的官网上都可以找到,我这里给大家一个网盘链接 LKD3588-开发板(公开资料) https://pan.baidu.com/s/1snYcWY-S4rLMCE_3nGlHrw?pwd3588 LKD3588-开发板(保密资料&…

STM32完全学习——点亮LED灯

一、寄存器描述 首先我们知道STM32对外设的操作,是靠对寄存器的设置来完成的。因此我们想要点亮LED灯,就需要知道端口的控制寄存器,然后给寄存器设置不同的值就可以让端口来输出0或1,首先我这里使用的是GPIOA这个端口的0-8位来做…

【Python】如何使用Python-Tkinter打造炫酷动态心形动画 !保姆级教程

文章目录 教程:从零开始,逐步实现动态心形动画环境准备第一步:导入必要的模块第二步:定义画布参数第三步:定义心形生成函数第四步:实现点的散布与收缩第五步:定义曲线函数第六步:创建…

基于SSM的“家政预约管理系统”的设计与实现(源码+数据库+文档+PPT)

基于SSM的“家政预约管理系统”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SSM 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 家政预约管理系统功能结构图 系统首页界面 用户注册界面 家政…

MongoDB在现代Web开发中的应用

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 MongoDB在现代Web开发中的应用 MongoDB在现代Web开发中的应用 MongoDB在现代Web开发中的应用 引言 MongoDB 概述 定义与原理 发展…

springboot企业信息管理系统,计算机毕业设计项目源码310,计算机毕设程序(LW+开题报告、中期报告、任务书等全套方案)

摘 要 传统信息的管理大部分依赖于管理人员的手工登记与管理,然而,随着近些年信息技术的迅猛发展,让许多比较老套的信息管理模式进行了更新迭代,员工信息因为其管理内容繁杂,管理数量繁多导致手工进行处理不能满足广…

【JAVA毕业设计】基于Vue和SpringBoot的周边产品销售网站

博主说明:本文项目编号 T 061 ,文末自助获取源码 \color{red}{T061,文末自助获取源码} T061,文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析…

YOLOV8应用|排球垫球计数|附带全部数据集与源码(见文末百度云盘链接)

项目简介: 该项目旨在利用YOLOv8算法实现排球垫球动作的自动识别与计数。YOLOv8作为计算机视觉领域的先进目标检测算法,具备高精度和实时性的特点,非常适合用于体育训练和测试中的自动化计数。项目将排球垫球视频作为输入,通过YOLOv8算法检测视频中的排球及垫球动作,自动…

【工具变量】上市公司企业生产经营效率数据集(1990-2023年)

一、计算说明: 参考《数量经济技术经济研究》沈坤荣(2024)老师的研究,为了度量企业生产经营效率,选取管理费用率(manage_cost)、营运资金周转率(fund_turn)和总资产周转…

Openstack10--认证服务(Keystone)安装

在控制节点安装认证服务组件 yum -y install openstack-keystone httpd mod_wsgi 其中“openstack-keystone”是Keystone的软件包;“httpd”是阿帕奇(Apache)Web服务器的软件包名;“mod_wsgi”是使Web服务器支持WSGI的插件。 进…

从0开始学PHP面向对象内容之(常用魔术方法续二)

哈喽朋友们,I am comming,今天把剩下的常用魔术方法讲了,话不多说开始正文 常用魔术方法(续二) 一、__toString() __toString() 是 PHP 提供的一个魔术方法,用于定义对象在被转换为字符串时的行为。它在某…

CSS 技巧:如何让 div 完美填充 td 高度

引言 一天哈比比突然冒出一个毫无理头的一个问题: 本文就该问题进行展开… 原文链接: 昆仑虚F2E 一、需求说明 大致需求如下, 当然这里做了些简化 有如下初始代码: 一个自适应的表格每个单元格的宽度固定 200px每个单元格高度则是自适应每个单元格内是一个 div 标签, div 标签…

清华、国科大、智谱团队提出LongReward:利用AI反馈改进长文本大语言模型

长文本(Long-context)大模型性能的优劣,在很大程度上取决于其能否全面理解长上下文场景下的复杂信息。 然而,现有的合成有监督微调(SFT)数据由于缺少人类核验,往往会影响长文本大模型的性能&am…

2024 年 10 款替代 Postman 的工具,有免费有开源

10 款替代 Postman 的工具,有免费有开源: 工具名称支持的系统是否免费是否开源ApifoxWindows, macOS, Linux免费否Yapi无限制是是InsomniaWindows, macOS, Linux免费版付费版是Hoppscotch浏览器是是SoapUIWindows, macOS, Linux免费版付费版是Katalon S…

IDEA报包不存在,但实际存在

IDEA版本2024.2.1 现象 在IDEA里启动运行项目,报某个类有问题,引入的包不存在。 点击这个引入的包,可以看到它在左侧外部库里存在。 试过的无效方法 双击ctrl,在弹出框中mvn idea:idea在文件里,清空缓存并重启在右…