概率分布的期望、方差和分布函数
在概率论与统计学中,不同的分布有其各自的数学特性。每种分布的期望(数学期望)表达了该随机变量在长期试验中所期望的平均值。以下我们对几种常见分布进行详细介绍,包含它们的定义、期望、方差和分布函数。
目录
- 均匀分布
- 指数分布
- 正态分布
- 二项分布
- 泊松分布
- 几何分布
- 负二项分布
- 超几何分布
1. 均匀分布 (Uniform Distribution)
- 定义:如果随机变量 X X X在区间 [ a , b ] [a, b] [a,b]上均匀分布,记为 X ∼ U ( a , b ) X \sim U(a, b) X∼U(a,b)。均匀分布意味着在 [ a , b ] [a, b] [a,b]区间内任何一个子区间内的数值出现的概率是相等的。
- 概率密度函数: f ( x ) = 1 b − a , a ≤ x ≤ b f(x) = \frac{1}{b-a}, \quad a \le x \le b f(x)=b−a1,a≤x≤b
- 期望: E ( X ) = a + b 2 E(X) = \frac{a + b}{2} E(X)=2a+b
- 方差: Var ( X ) = ( b − a ) 2 12 \text{Var}(X) = \frac{(b - a)^2}{12} Var(X)=12(b−a)2
- 分布函数:
F ( x ) = { 0 if x < a x − a b − a if a ≤ x ≤ b 1 if x > b F(x) = \begin{cases} 0 & \text{if } x < a \\ \frac{x - a}{b - a} & \text{if } a \leq x \leq b \\ 1 & \text{if } x > b \end{cases} F(x)=⎩ ⎨ ⎧0b−ax−a1if x<aif a≤x≤bif x>b - 性质:均匀分布是最简单的连续分布之一,主要用于表示等可能性事件。例如,生成伪随机数时,通常使用均匀分布。
2. 指数分布 (Exponential Distribution)
- 定义:如果随机变量 X X X的出现时间服从指数分布,记为 X ∼ E ( λ ) X \sim E(\lambda) X∼E(λ),其中参数 λ > 0 \lambda > 0 λ>0是事件发生的速率。
- 概率密度函数: f ( x ) = λ e − λ x , x ≥ 0 f(x) = \lambda e^{-\lambda x}, \quad x \ge 0 f(x)=λe−λx,x≥0
- 期望: E ( X ) = 1 λ E(X) = \frac{1}{\lambda} E(X)=λ1
- 方差: Var ( X ) = 1 λ 2 \text{Var}(X) = \frac{1}{\lambda^2} Var(X)=λ21
- 分布函数:
F ( x ) = { 0 if x < 0 1 − e − λ x if x ≥ 0 F(x) = \begin{cases} 0 & \text{if } x < 0 \\ 1 - e^{-\lambda x} & \text{if } x \geq 0 \end{cases} F(x)={01−e−λxif x<0if x≥0 - 性质:指数分布是无记忆性的,即 P ( X > s + t ∣ X > s ) = P ( X > t ) P(X > s + t | X > s) = P(X > t) P(X>s+t∣X>s)=P(X>t),表示一个事件发生的概率与过去的发生情况无关。广泛应用于等待时间模型中,如排队理论和生存分析。
3. 正态分布 (Normal Distribution)
- 定义:如果随机变量 X X X服从均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2的正态分布,记为 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2)。正态分布广泛出现在自然和社会科学中,是最重要的连续分布之一。
- 概率密度函数: f ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} f(x)=2πσ21e−2σ2(x−μ)2
- 期望: E ( X ) = μ E(X) = \mu E(X)=μ
- 方差: Var ( X ) = σ 2 \text{Var}(X) = \sigma^2 Var(X)=σ2
- 分布函数:
F ( x ) = 1 2 π σ 2 ∫ − ∞ x e − ( t − μ ) 2 2 σ 2 d t = Φ ( x − μ σ ) F(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \int_{-\infty}^{x} e^{-\frac{(t - \mu)^2}{2\sigma^2}} \, dt = \Phi\left(\frac{x - \mu}{\sigma}\right) F(x)=2πσ21∫−∞xe−2σ2(t−μ)2dt=Φ(σx−μ)
其中, Φ ( z ) \Phi(z) Φ(z)是标准正态分布的分布函数。 - 性质:正态分布的形状为钟形,对称分布,均值和中位数相等。正态分布的线性组合仍为正态分布,在中心极限定理中占有重要地位。
4. 二项分布 (Binomial Distribution)
- 定义:如果随机变量 X X X表示 n n n次独立重复试验中成功的次数,且每次试验成功的概率为 p p p,则称 X X X服从二项分布,记为 X ∼ B ( n , p ) X \sim B(n, p) X∼B(n,p)。
- 概率质量函数: P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , … , n P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0, 1, \ldots, n P(X=k)=(kn)pk(1−p)n−k,k=0,1,…,n
- 期望: E ( X ) = n p E(X) = np E(X)=np
- 方差: Var ( X ) = n p ( 1 − p ) \text{Var}(X) = np(1 - p) Var(X)=np(1−p)
- 分布函数:
F ( x ) = ∑ k = 0 ⌊ x ⌋ ( n k ) p k ( 1 − p ) n − k F(x) = \sum_{k=0}^{\lfloor x \rfloor} \binom{n}{k} p^k (1 - p)^{n - k} F(x)=k=0∑⌊x⌋(kn)pk(1−p)n−k
其中, ⌊ x ⌋ \lfloor x \rfloor ⌊x⌋表示不超过 x x x的最大整数。 - 性质:二项分布描述了独立重复试验中成功次数的分布情况,是离散分布的一种常见形式,在质量控制、决策分析中广泛应用。
5. 泊松分布 (Poisson Distribution)
- 定义:泊松分布描述了一定时间或空间内随机事件的出现次数。如果事件发生的平均率为 λ \lambda λ,则 X ∼ Poisson ( λ ) X \sim \text{Poisson}(\lambda) X∼Poisson(λ)。
- 概率质量函数: P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , … P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots P(X=k)=k!λke−λ,k=0,1,2,…
- 期望: E ( X ) = λ E(X) = \lambda E(X)=λ
- 方差: Var ( X ) = λ \text{Var}(X) = \lambda Var(X)=λ
- 分布函数:
F ( x ) = ∑ k = 0 ⌊ x ⌋ λ k e − λ k ! F(x) = \sum_{k=0}^{\lfloor x \rfloor} \frac{\lambda^k e^{-\lambda}}{k!} F(x)=k=0∑⌊x⌋k!λke−λ
其中, ⌊ x ⌋ \lfloor x \rfloor ⌊x⌋表示不超过 x x x的最大整数。 - 性质:泊松分布是描述稀有事件的分布,通常用来建模单位时间或空间中的事件数,例如电话呼叫数、事故发生数等。泊松分布可视为二项分布在试验次数 n → ∞ n \to \infty n→∞且成功概率 p → 0 p \to 0 p→0时的极限。
6. 几何分布 (Geometric Distribution)
- 定义:几何分布描述了在独立重复试验中首次成功所需的试验次数。如果每次试验成功的概率为 p p p,则 X ∼ Geo ( p ) X \sim \text{Geo}(p) X∼Geo(p)。
- 概率质量函数: P ( X = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , … P(X = k) = (1 - p)^{k-1} p, \quad k = 1, 2, \ldots P(X=k)=(1−p)k−1p,k=1,2,…
- 期望: E ( X ) = 1 p E(X) = \frac{1}{p} E(X)=p1
- 方差: Var ( X ) = 1 − p p 2 \text{Var}(X) = \frac{1 - p}{p^2} Var(X)=p21−p
- 分布函数:
F ( x ) = 1 − ( 1 − p ) ⌊ x ⌋ F(x) = 1 - (1 - p)^{\lfloor x \rfloor} F(x)=1−(1−p)⌊x⌋
其中, ⌊ x ⌋ \lfloor x \rfloor ⌊x⌋表示不超过 x x x的最大整数。 - 性质:几何分布是无记忆性的,即 P ( X > s + t ∣ X > s ) = P ( X > t ) P(X > s + t | X > s) = P(X > t) P(X>s+t∣X>s)=P(X>t),表示首次成功所需的试验次数与过去失败的次数无关。
7. 负二项分布 (Negative Binomial Distribution)
- 定义:负二项分布描述了在独立重复试验中第 r r r次成功所需的试验次数。如果每次试验成功的概率为 p p p,则 X ∼ NB ( r , p ) X \sim \text{NB}(r, p) X∼NB(r,p)。
- 概率质量函数: P ( X = k ) = ( k − 1 r − 1 ) p r ( 1 − p ) k − r , k = r , r + 1 , … P(X = k) = \binom{k-1}{r-1} p^r (1 - p)^{k-r}, \quad k = r, r+1, \ldots P(X=k)=(r−1k−1)pr(1−p)k−r,k=r,r+1,…
- 期望: E ( X ) = r p E(X) = \frac{r}{p} E(X)=pr
- 方差: Var ( X ) = r ( 1 − p ) p 2 \text{Var}(X) = \frac{r(1 - p)}{p^2} Var(X)=p2r(1−p)
- 分布函数:
F ( x ) = ∑ k = r ⌊ x ⌋ ( k − 1 r − 1 ) p r ( 1 − p ) k − r F(x) = \sum_{k=r}^{\lfloor x \rfloor} \binom{k-1}{r-1} p^r (1 - p)^{k-r} F(x)=k=r∑⌊x⌋(r−1k−1)pr(1−p)k−r
其中, ⌊ x ⌋ \lfloor x \rfloor ⌊x⌋表示不超过 x x x的最大整数。 - 性质:负二项分布是几何分布的推广,描述了多次成功所需的试验次数。
8. 超几何分布 (Hypergeometric Distribution)
- 定义:超几何分布描述了从有限总体中不放回抽样的情况下,成功次数的分布。设总体中有 N N N个元素,其中 K K K个是成功的,抽取 n n n个元素,则 X ∼ Hyper ( N , K , n ) X \sim \text{Hyper}(N, K, n) X∼Hyper(N,K,n)。
- 概率质量函数: P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) , k = 0 , 1 , … , min ( n , K ) P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}, \quad k = 0, 1, \ldots, \min(n, K) P(X=k)=(nN)(kK)(n−kN−K),k=0,1,…,min(n,K)
- 期望: E ( X ) = n K N E(X) = n \frac{K}{N} E(X)=nNK
- 方差: Var ( X ) = n K N N − K N N − n N − 1 \text{Var}(X) = n \frac{K}{N} \frac{N-K}{N} \frac{N-n}{N-1} Var(X)=nNKNN−KN−1N−n
- 分布函数:
F ( x ) = ∑ k = 0 ⌊ x ⌋ ( K k ) ( N − K n − k ) ( N n ) F(x) = \sum_{k=0}^{\lfloor x \rfloor} \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}} F(x)=k=0∑⌊x⌋(nN)(kK)(n−kN−K)
其中, ⌊ x ⌋ \lfloor x \rfloor ⌊x⌋表示不超过 x x x的最大整数。 - 性质:超几何分布描述了不放回抽样的情况,与二项分布相比,超几何分布考虑了样本抽取对总体的影响。
期望和方差的推导过程
1. 均匀分布 X ∼ U ( a , b ) X \sim U(a, b) X∼U(a,b)
期望的推导:
E ( X ) = ∫ a b x ⋅ 1 b − a d x = 1 b − a ⋅ x 2 2 ∣ a b = 1 b − a ⋅ b 2 − a 2 2 = a + b 2 E(X) = \int_a^b x \cdot \frac{1}{b - a} \, dx = \frac{1}{b - a} \cdot \frac{x^2}{2} \Big|_a^b = \frac{1}{b - a} \cdot \frac{b^2 - a^2}{2} = \frac{a + b}{2} E(X)=∫abx⋅b−a1dx=b−a1⋅2x2 ab=b−a1⋅2b2−a2=2a+b
方差的推导:
E ( X 2 ) = 1 b − a ⋅ x 3 3 ∣ a b = 1 b − a ⋅ b 3 − a 3 3 E(X^2) = \frac{1}{b - a} \cdot \frac{x^3}{3} \Big|_a^b = \frac{1}{b - a} \cdot \frac{b^3 - a^3}{3} E(X2)=b−a1⋅3x3 ab=b−a1⋅3b3−a3
Var ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = a 2 + a b + b 2 3 − ( a + b 2 ) 2 = ( b − a ) 2 12 \text{Var}(X) = E(X^2) - [E(X)]^2 = \frac{a^2 + ab + b^2}{3} - \left(\frac{a + b}{2}\right)^2 = \frac{(b - a)^2}{12} Var(X)=E(X2)−[E(X)]2=3a2+ab+b2−(2a+b)2=12(b−a)2
2. 指数分布 X ∼ E ( λ ) X \sim E(\lambda) X∼E(λ)
期望的推导:
E ( X ) = ∫ 0 ∞ x ⋅ λ e − λ x d x = 1 λ E(X) = \int_0^{\infty} x \cdot \lambda e^{-\lambda x} \, dx = \frac{1}{\lambda} E(X)=∫0∞x⋅λe−λxdx=λ1
方差的推导:
E ( X 2 ) = ∫ 0 ∞ x 2 ⋅ λ e − λ x d x = 2 λ 2 E(X^2) = \int_0^{\infty} x^2 \cdot \lambda e^{-\lambda x} \, dx = \frac{2}{\lambda^2} E(X2)=∫0∞x2⋅λe−λxdx=λ22
Var ( X ) = 2 λ 2 − ( 1 λ ) 2 = 1 λ 2 \text{Var}(X) = \frac{2}{\lambda^2} - \left(\frac{1}{\lambda}\right)^2 = \frac{1}{\lambda^2} Var(X)=λ22−(λ1)2=λ21
3. 正态分布 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2)
期望的推导:
对称性可知,期望为 E ( X ) = μ E(X) = \mu E(X)=μ。
方差的推导:
由正态分布的性质,方差为 Var ( X ) = σ 2 \text{Var}(X) = \sigma^2 Var(X)=σ2。
4. 二项分布 X ∼ B ( n , p ) X \sim B(n, p) X∼B(n,p)
期望的推导:
二项分布可以看作 n n n次独立伯努利试验的总和。每次试验成功的概率为 p p p,因此 E ( X ) = n p E(X) = np E(X)=np。
方差的推导:
二项分布的方差为 Var ( X ) = n p ( 1 − p ) \text{Var}(X) = np(1 - p) Var(X)=np(1−p)。
5. 泊松分布 X ∼ Poisson ( λ ) X \sim \text{Poisson}(\lambda) X∼Poisson(λ)
期望的推导:
泊松分布的期望可以通过计算其概率生成函数得出,结果为 E ( X ) = λ E(X) = \lambda E(X)=λ。
方差的推导:
泊松分布的方差也是 Var ( X ) = λ \text{Var}(X) = \lambda Var(X)=λ。
6. 几何分布 X ∼ Geo ( p ) X \sim \text{Geo}(p) X∼Geo(p)
期望的推导:
E ( X ) = ∑ k = 1 ∞ k ( 1 − p ) k − 1 p = 1 p E(X) = \sum_{k=1}^{\infty} k (1 - p)^{k-1} p = \frac{1}{p} E(X)=k=1∑∞k(1−p)k−1p=p1
方差的推导:
E ( X 2 ) = ∑ k = 1 ∞ k 2 ( 1 − p ) k − 1 p = 2 − p p 2 E(X^2) = \sum_{k=1}^{\infty} k^2 (1 - p)^{k-1} p = \frac{2 - p}{p^2} E(X2)=k=1∑∞k2(1−p)k−1p=p22−p
Var ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = 2 − p p 2 − ( 1 p ) 2 = 1 − p p 2 \text{Var}(X) = E(X^2) - [E(X)]^2 = \frac{2 - p}{p^2} - \left(\frac{1}{p}\right)^2 = \frac{1 - p}{p^2} Var(X)=E(X2)−[E(X)]2=p22−p−(p1)2=p21−p
7. 负二项分布 X ∼ NB ( r , p ) X \sim \text{NB}(r, p) X∼NB(r,p)
期望的推导:
E ( X ) = ∑ k = r ∞ k ( k − 1 r − 1 ) p r ( 1 − p ) k − r = r p E(X) = \sum_{k=r}^{\infty} k \binom{k-1}{r-1} p^r (1 - p)^{k-r} = \frac{r}{p} E(X)=k=r∑∞k(r−1k−1)pr(1−p)k−r=pr
方差的推导:
E ( X 2 ) = ∑ k = r ∞ k 2 ( k − 1 r − 1 ) p r ( 1 − p ) k − r = r ( r + 1 ) ( 1 − p ) p 2 E(X^2) = \sum_{k=r}^{\infty} k^2 \binom{k-1}{r-1} p^r (1 - p)^{k-r} = \frac{r(r+1)(1-p)}{p^2} E(X2)=k=r∑∞k2(r−1k−1)pr(1−p)k−r=p2r(r+1)(1−p)
Var ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = r ( r + 1 ) ( 1 − p ) p 2 − ( r p ) 2 = r ( 1 − p ) p 2 \text{Var}(X) = E(X^2) - [E(X)]^2 = \frac{r(r+1)(1-p)}{p^2} - \left(\frac{r}{p}\right)^2 = \frac{r(1 - p)}{p^2} Var(X)=E(X2)−[E(X)]2=p2r(r+1)(1−p)−(pr)2=p2r(1−p)
8. 超几何分布 X ∼ Hyper ( N , K , n ) X \sim \text{Hyper}(N, K, n) X∼Hyper(N,K,n)
期望的推导:
E ( X ) = n K N E(X) = n \frac{K}{N} E(X)=nNK
方差的推导:
Var ( X ) = n K N N − K N N − n N − 1 \text{Var}(X) = n \frac{K}{N} \frac{N-K}{N} \frac{N-n}{N-1} Var(X)=nNKNN−KN−1N−n