常见统计量与其抽样分布

什么是统计量

我们首先给出统计量的定义:设 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,,Xn 为来自于总体X的一个样本, g ( X 1 , X 2 , ⋯ , X n ) g(X_1,X_2,\cdots,X_n) g(X1,X2,,Xn) 为关于 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,,Xn的函数,如果g中不含未知参数,则其被称为是一个统计量。
用大白话来说就是用都是已知的数据做计算就是一个统计量,把数据相加,相减,求平均,求次方等等结果全部都是一个统计量。

而有些统计量在生活中更具有实际意义和使用价值,大家使用的也比较多,所以有如下常用的统计量:
样本均值:
X ˉ = 1 n ∑ i = 1 n X i \bar X = \frac1n \sum\limits_{i=1}^{n} X_i Xˉ=n1i=1nXi
样本方差:
S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 = 1 n − 1 ( ∑ i = 1 n X i 2 − n X ˉ 2 ) S^2 = \frac1{n-1}\sum\limits^{n}_{i=1}(X_i-\bar X)^2=\frac1{n-1}(\sum\limits_{i=1}^{n} X_i^2 - n \bar X^2) S2=n11i=1n(XiXˉ)2=n11(i=1nXi2nXˉ2)
样本标准差:
S = 1 n − 1 ( ∑ i = 1 n X i 2 − n X ˉ 2 ) S=\sqrt{\frac1{n-1}(\sum\limits_{i=1}^{n} X_i^2 - n \bar X^2)} S=n11(i=1nXi2nXˉ2)
k阶原点矩
A k = 1 n ∑ i = 1 n X i k , k = 1 , 2 , ⋯ ; A_k=\frac1n \sum\limits_{i=1}^{n}X_i^{k},k=1,2,\cdots; Ak=n1i=1nXik,k=1,2,;
k阶中心矩
B k = 1 n ∑ i = 1 n ( X i − X ˉ ) k , k = 2 , 3 , ⋯ ; B_k=\frac1n\sum\limits_{i=1}^{n}(X_i - \bar X)^k,k=2,3,\cdots; Bk=n1i=1n(XiXˉ)k,k=2,3,;
需要注意的就是样本方差的分母是n-1,主要是考虑到无偏性,具体的推导可以参考:https://blog.csdn.net/qq_42692386/article/details/137955127

抽样分布

什么是抽样分布

首先来辨别一下统计中常说的几个词:总体分布,样本分布,抽样分布。

总体分布是总体中各元素的观察值所形成的相对频数分布,例如之前说过的二项分布,整个总体中的元素都是只有0和1两个取值,根据总体分布可以得到总体均值 μ \mu μ和总体方差 σ 2 {\sigma }^{2} σ2等。
样本分布是从总体中抽出一个容量为n的样本,由这n个观察值形成的相对频数分布,称为样本分布。用来描述样本分布的样本统计量有样本均值 X ˉ \bar X Xˉ和样本方差 S 2 S^2 S2

抽样分布:抽样分布是指样本统计量的概率分布。对于抽样分布的理解最核心的点是:样本统计量是被当成了一个随机变量来看待的,它是统计量的概率分布
以样本均值为例,在之前说到的样本分布中是一个具体的值,是在总体中抽到的个数为n的一个样本加总平均计算得到的一个固定的值,但是这个值是只抽取一组样本计算的一个样本均值结果,在整个总体中还可以抽出其他更多的个数为n的样本,每抽取一组样本都可以计算出一个样本均数,而且这些样本均数或多或少都会有些差异。

我们不妨用身高的这个例子还原一下这个过程。假设我们现在想了解中国成年男子的身高情况,通过简单随机抽样获取了一个1000人的样本,计算出样本均值为1.76(米),样本标准差为0.1(米)。现在,我们按照同样的方法重复抽100次,每次都抽取1000人。在这个过程中我们实际一共调查了10万人,不过这10万人以1000人为一组被分成了100个样本,而每一组都可以计算一个样本均值,假设分别为:1.76,1.72,1.69,1.77,……,1.75,这就是一个关于身高的样本均值的抽样分布。由此,我们一共获得了100个样本均值,从而可以对这100个数求平均数和标准差。

在统计后面的学习中,我们经常会看到样本均值有 E ( X ˉ ) = μ , D ( X ˉ ) = σ 2 n E(\bar X)=\mu,D(\bar X)=\frac{\sigma^2}{n} E(Xˉ)=μ,D(Xˉ)=nσ2这样的公式,也就是样本均值的期望等于总体期望,样本均值的方差是总体方差的 1 n \frac{1}{n} n1,这里的式子中的 X ˉ \bar X Xˉ就是一个随机变量,如果理解为一个样本下的均值理解为一个常数值的话,那么你就会疑惑为什么一个常数值得方差不是0而是 σ 2 n \frac{\sigma^2}{n} nσ2

三大抽样分布

在正态总体的条件下有如下三个常用统计量的分布

卡方分布( χ 2 \chi^2 χ2

X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,,Xn为来自总体 N ( 0 , 1 ) N(0,1) N(0,1)的样本,则称统计量 χ 2 = X 1 2 + X 2 2 + ⋯ + X n 2 \chi^2=X_1^2+X_2^2+\cdots+X_n^2 χ2=X12+X22++Xn2服从自由度为n的卡方分布,记为 χ 2 ∼ χ 2 ( n ) \chi ^2 \sim \chi^2(n) χ2χ2(n)
卡方分布的概率密度函数和图像如下:
f ( y ) = 1 2 n / 2 Γ ( n / 2 ) y n / 2 − 1 e − y / 2 , y > 0 f(y) = \frac{1}{2^{n/2}\Gamma(n/2)} y^{n/2 - 1} e^{-y/2},y>0 f(y)=2n/2Γ(n/2)1yn/21ey/2y>0
其中 Γ ( n / 2 ) \Gamma(n/2) Γ(n/2)是伽马函数。(一般教材中会有这些内容,但好像有的专业不做要求,只要知道相关性质就可以了,关于伽马函数可自行百度)
在这里插入图片描述
卡方分布有如下性质:
1.可加性:设 χ 1 2 ∼ χ 2 ( n 1 ) , χ 2 2 ∼ χ 2 ( n 2 ) \chi _1^2 \sim \chi ^2(n_1),\chi_2^2 \sim \chi^2(n_2) χ12χ2(n1),χ22χ2(n2) χ 1 2 , χ 2 2 \chi_1^2,\chi_2^2 χ12,χ22相互独立,那么有 χ 1 2 + χ 2 2 ∼ χ 2 ( n 1 + n 2 ) \chi_1^2+\chi_2^2 \sim \chi^2(n_1+n_2) χ12+χ22χ2(n1+n2)
2.期望和方差:假设 χ 2 ∼ χ 2 ( n ) \chi ^2 \sim \chi^2(n) χ2χ2(n),则有 E ( χ 2 ) = n , D ( χ 2 ) = 2 n E(\chi^2)=n,D(\chi^2)=2n E(χ2)=n,D(χ2)=2n
3.上 α \alpha α分位点:对于给定的正数 α , 0 < α < 1 \alpha,0<\alpha<1 α,0<α<1,称满足条件 P { χ 2 > χ α 2 ( n ) } = ∫ χ α 2 ( n ) ∞ f ( y ) d y = α P\{\chi^2 > \chi^2_\alpha(n)\}=\int_{ \chi^2_\alpha(n)}^{\infty}f(y)\mathrm{d}y=\alpha P{χ2>χα2(n)}=χα2(n)f(y)dy=α的点 χ α 2 ( n ) \chi^2_\alpha(n) χα2(n)为分布的上 α \alpha α分位点
在这里插入图片描述

t分布

X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X \sim N(0,1),Y \sim \chi^2(n) XN(0,1),Yχ2(n),且 X , Y X,Y X,Y相互独立,那么我们称随机变量 t = X Y / n t=\frac{X}{\sqrt{Y/n}} t=Y/n X服从自由度为 n n n t t t分布,也称为学生分布。
t分布的概率密度函数和图像如下:
在这里插入图片描述
卡方分布有如下性质:
对称性: t 1 − α ( n ) = − t α ( n ) t_{1-\alpha}(n)=-t_{\alpha}(n) t1α(n)=tα(n),类似于正态分布
期望与方差: E ( t α ( n ) ) = 0 , D ( t α ( n ) ) = n n − 2 E(t_\alpha(n))=0,D(t_\alpha(n))=\frac{n}{n-2} E(tα(n))=0,D(tα(n))=n2n
大样本情况下近似于正态分布: n > 45 , t α ( n ) ≈ z α n>45,t_\alpha(n)\approx z_\alpha n>45tα(n)zα

F分布

U ∼ χ 2 ( n 1 ) , V ∼ χ 2 ( n 2 ) U \sim \chi^2(n_1),V \sim \chi^2(n_2) Uχ2(n1),Vχ2(n2),且 U , V U,V U,V相互独立,则称随机变量 F = U / n 1 V / n 2 F=\frac{U/n_1}{V/n_2} F=V/n2U/n1服从自由度为 ( n 1 , n 2 ) (n_1,n_2) (n1,n2) F F F分布,记为 F ∼ F ( n 1 , n 2 ) F \sim F(n_1,n_2) FF(n1,n2)
F分布的概率密度函数图像如下:
在这里插入图片描述
F分布的性质如下:
如有 F ∼ F ( n 1 , n 2 ) , 则 1 F ∼ F ( n 2 , n 1 ) 如有F \sim F(n_1,n_2), 则\frac1{F} \sim F(n_2,n_1) 如有FF(n1,n2),F1F(n2,n1)
F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) F_{1-\alpha}(n_1,n_2)=\frac{1}{F_{\alpha}(n_2,n_1)} F1α(n1,n2)=Fα(n2,n1)1

正态总体的样本均值与样本方差的分布

之前我们说过抽样分布就是对统计量的概率分布的描述,我们知道日常生活中的大样本基本服从正态分布,而我们一般无法统计总体只能进行抽样并只能得到样本均值和样本方差,所以研究正态总体的样本均值与样本方差的分布就有相当重要的意义。在之后我们会说到区间估计与假设检验就是这方面的实际应用和扩展。

设总体 X X X(不管服从什么分布,只要方差和均值存在)的均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2, X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,,Xn为来自总体 X X X的一个样本,样本均值为 X ˉ \bar X Xˉ,样本方差为 S 2 S^2 S2,则有:
E ( X ˉ ) = μ , D ( X ˉ ) = σ 2 n , E ( S 2 ) = σ 2 E(\bar X)=\mu,D(\bar X)=\frac{\sigma^2}{n},E(S^2)=\sigma^2 E(Xˉ)=μ,D(Xˉ)=nσ2E(S2)=σ2

进而设 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) XN(μ,σ2),即在正态总体下,设 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,,Xn为来自正态总体总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) XN(μ,σ2)的一个样本,样本均值为 X ˉ \bar X Xˉ,样本方差为 S 2 S^2 S2,则 X ˉ \bar X Xˉ S 2 S^2 S2相互独立,且有如下结论:
结论1:
X ˉ ∼ N ( μ , σ 2 n ) \bar{X} \sim N(\mu, \dfrac{\sigma^2}{n}) XˉN(μ,nσ2)
证明:根据正态分布的可加性,设 X 1 , X 2 , ⋯ , X n ∼ N ( μ , σ 2 ) X_1,X_2,\cdots,X_n\sim N(\mu,\sigma^2) X1,X2,,XnN(μ,σ2),可得
X 1 + X 2 + ⋯ + X n ∼ N ( n μ , n σ 2 ) X_1+X_2+\cdots+X_n\sim N(n\mu,n\sigma^2) X1+X2++XnN(nμ,nσ2)
X ˉ = X 1 + X 2 + ⋯ + X n n ∼ N ( μ , σ 2 n ) \bar{X}=\dfrac{X_1+X_2+\cdots+X_n}{n}\sim N\left(\mu,\dfrac{\sigma^2}{n}\right) Xˉ=nX1+X2++XnN(μ,nσ2)

转化为标准型有:
X ˉ − μ σ / n ∼ N ( 0 , 1 ) \begin{align} \frac{\bar{X}-\mu}{\sigma / \sqrt{n}} \sim N(0,1) \end{align} σ/n XˉμN(0,1)

结论2:
1 σ 2 ∑ i = 1 n ( X i − μ ) 2 = ∑ 1 n ( X i − μ σ ) 2 ∼ χ 2 ( n ) \dfrac{1}{\sigma^2} \sum\limits^{n}_{i=1}\left(X_i-\mu \right)^2= \sum\limits^{n}_{1}\left(\frac{X_i-\mu}{\sigma}\right)^2 \sim \chi^2(n) σ21i=1n(Xiμ)2=1n(σXiμ)2χ2(n)

结论3:
( n − 1 ) S 2 σ 2 = ∑ i = 1 n ( X i − X ˉ σ ) 2 ∼ χ 2 ( n − 1 ) \dfrac{(n-1)S^2}{\sigma^2}= \sum\limits^{n}_{i=1}\left(\frac{X_i-\bar X}{\sigma}\right)^2 \sim \chi^2(n-1) σ2(n1)S2=i=1n(σXiXˉ)2χ2(n1)

结论4:
n ⋅ ( X ˉ − μ ) S ∼ t ( n − 1 ) \dfrac{\sqrt{n}\cdot(\bar{X}-\mu)}{S}\sim t(n-1) Sn (Xˉμ)t(n1)

结论5:
n ⋅ ( X ˉ − μ ) 2 S 2 ∼ F ( 1 , n − 1 ) \dfrac{n\cdot(\bar{X}-\mu)^2}{S^2}\sim F(1,n-1) S2n(Xˉμ)2F(1,n1)
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1544794.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【2024W37】肖恩技术周刊(第 15 期):中秋节快乐

周刊内容: 对一周内阅读的资讯或技术内容精品&#xff08;个人向&#xff09;进行总结&#xff0c;分类大致包含“业界资讯”、“技术博客”、“开源项目”和“工具分享”等。为减少阅读负担提高记忆留存率&#xff0c;每类下内容数一般不超过3条。 更新时间: 星期天 历史收录:…

微服务——配置管理

1.配置管理 微服务配置管理是指对微服务架构中各个服务的配置信息进行管理、更新、查询和审计等操作&#xff0c;以确保系统的正常运行和高效管理。例如&#xff0c;网关路由或某些业务配置在配置文件中写死了&#xff0c;每次修改都要重启服务。每个微服务都有很多重复的配置&…

同等学力英语历年真题有必要做吗

同等学力申硕历年真题是考生备考期间最重要的参考资料&#xff0c;在做真题的时候对那些经常出现的词汇要进行汇总整理&#xff0c;记忆高频词汇。 当你在阅读文章的时候发现不认识的单词或者一个熟悉的单词但是放在句子当中却读不通顺的这类单词的时候&#xff0c;一定要做好标…

WinCC中VB脚本和C脚本到底怎么选?

很多人认为VB脚本比C脚本慢&#xff0c;所以在WinCC中要尽量使用C脚本&#xff0c;以便提高性能&#xff0c;事实真是这样吗&#xff1f;工控人加入PLC工业自动化精英社群 先说结论&#xff1a;并非如此。在一个复杂的应用中&#xff0c;混合使用VB脚本和C脚本&#xff0c;对提…

mes系统在中小企业智能制造作用

MES系统&#xff08;制造执行系统&#xff09;在中小企业智能制造中扮演着至关重要的角色&#xff0c;其作用主要体现在以下几个方面&#xff1a; 1. 提升生产效率与质量 实时监控与数据采集&#xff1a;MES系统能够实时采集生产现场的各项数据&#xff0c;如设备状态、生产进…

Maya学习笔记:软选择

文章目录 打开软选择调整软选择范围衰减模式 软选择可以很好的进行渐变修改 打开软选择 方法1&#xff1a; 进入点线面模式&#xff0c;按B键进入软选择模式&#xff0c;再按B取消 方法2&#xff1a;双击左侧的选择按钮打开选择面板&#xff0c;勾选软选择 调整软选择范围 …

input文本框随其中内容而变化长

<!DOCTYPE html> <html lang="en"><head><meta charset="UTF-8"><title>input文本框随其中内容而变化长</title><style>.input-length {border: 1px solid #ccc;padding: 5px;min-width: 10px;width: auto;}.in…

物联网实践教程:微信小程序结合OneNET平台MQTT实现STM32单片机远程智能控制 远程上报和接收数据——STM32代码实现篇

STM32代码实现 开启本章节需要完成下方的前置任务&#xff1a; 点击跳转&#xff1a; 物联网实践教程&#xff1a;微信小程序结合OneNET平台MQTT实现STM32单片机远程智能控制 远程上报和接收数据——汇总 目标 1.连接OneNET&#xff1a;STM32使用串口与ESP8266/01s连接发送…

node.js npm 安装和安装create-next-app

1、官网下载windows版本NODE.JS https://nodejs.org/dist/v20.17.0/node-v20.17.0-x64.msi 2、安装后增加两个文件夹目录node_global、node_cache npm config set prefix "C:\Program Files\nodejs\node_global" npm config set prefix "C:\Program Files\nod…

828华为云征文 | 云服务器Flexus X实例,Docker集成搭建超级马里奥

828华为云征文 | 云服务器Flexus X实例&#xff0c;Docker集成搭建超级马里奥 华为云端口放行 服务器放行对应端口5000 Docker安装并配置镜像加速 1、购买华为云 Flexus X 实例 Flexus云服务器X实例-华为云 (huaweicloud.com) 2、docker安装 yum install -y docker-ce3、验证 …

网络编程——TCP网络通信

通信步骤&#xff1a; 1、连接 2、传输数据 3、关闭连接服务端的创建流程&#xff1a; 1、创建服务端socket对象 socket_family:网络地址类型AF_INET--代表的是ipv4地址类型 socket_type:套接字类型SOCK_STREAM--代表的是tcp套接字SOCK_DGRAM--代表的是udp套接字 2、绑定自己的…

企业如何利用短视频平台做口碑塑造和品牌营销?

抖音和小红书作为短视频平台的代表&#xff0c;吸引了大量的用户和品牌。如何利用抖音、小红书等短视频平台进行品牌塑造和口碑营销呢&#xff1f;小马识途营销顾问分析&#xff0c;短视频平台的用户以年轻人为主&#xff0c;他们具有高度的社交性和消费意愿。短视频平台提供了…

使用Java基于GeoTools读取Shapefile矢量数据属性信息-以某市POI数据为例

前言 在之前的博客中&#xff0c;我们讲过在GDAL中如何读取空间数据的属性和数据信息&#xff0c;也简单的讲过如何在GeoTools中读取Shapefile文件的属性信息和数据信息。对于空间矢量数据库&#xff0c;就像我们传统的二维数据库的表字段和表数据的关系&#xff0c;在研究表数…

[大语言模型-论文精读] ACL2024-长尾知识在检索增强型大型语言模型中的作用

ACL2024-长尾知识在检索增强型大型语言模型中的作用 On the Role of Long-tail Knowledge in Retrieval Augmented Large Language Models Authors: Dongyang Li, Junbing Yan, Taolin Zhang, Chengyu Wang, Xiaofeng He, Longtao Huang, Hui Xue, Jun Huang 1.概览 问题解决&…

引领开放式耳机革命,南卡新品再次霸榜音质和舒适度TOP1!

​随着科技的不断进步&#xff0c;消费者对于耳机的需求已经不仅仅局限于基本的听觉体验&#xff0c;而是追求更加舒适、个性化的聆听感受。南卡科技推出的Ultra夹耳开放式蓝牙耳机&#xff0c;以其创新的设计和卓越的音质&#xff0c;为用户带来了全新的听觉盛宴。 南卡科技&a…

【Linux探索学习】第一弹——Linux的基本指令(上)——开启Linux学习第一篇

前言&#xff1a; 在进入Linux学习之前&#xff0c;我们首先要先做好以下两点&#xff1a;1、已经基本掌握C语言或C&#xff0c;2、已经配置好了Linux的环境&#xff0c;做完以上两点后我们就开始Linux的学习&#xff0c;今天我们首先要学习的就是Linux中最基础的操作&#xff…

Python自动化测试之unittest框架

一、什么是框架 框架是由大佬开发或者专业的研发团队研发的技术骨架&#xff0c;框架是一个半成品&#xff0c;框架是对常用的功能&#xff0c;基础的代码进行封装的一个工具&#xff0c;这个工具对外提供了一些API&#xff0c;其他的开发者只需要调用框架的接口即可&#xff…

C++语言桌面应用开发GTK3 Gtkmm3 Glade

文章目录 Gikmm 简介安装 Gtkmm安装 GTK安装 Gladedemo.glade 文件完整示例 demo.cpp编译运行GTK 主题推荐主题 Gikmm 简介 Gtkmm 是一个用于创建图形用户界面&#xff08;GUI&#xff09;的 C 库&#xff0c;它是基于流行的 GTK 库的。GTK 是一个跨平台的 GUI 工具包&#xff…

HTML5基本概念及其基本框架

HTML是超文本标记语言&#xff08;英语&#xff1a;HyperText Markup Language&#xff0c;简称&#xff1a;HTML&#xff09;是一种用来结构化 Web 网页及其内容的标记语言。网页内容可以是&#xff1a;一组段落、一个重点信息列表、也可以含有图片和数据表。 H5的DOCTYPE的声…

新手操作指引:快速上手腾讯混元大模型

引言 腾讯混元大模型是一款功能强大的AI工具&#xff0c;适用于文本生成、图像创作和视频生成等多种应用场景。对于新手用户&#xff0c;快速上手并充分利用这一工具可能会有些挑战。本文将提供详细的新手操作指引&#xff0c;帮助您轻松开始使用腾讯混元大模型。 步骤一&…