数据统计的一些专业术语学习

数据统计的一些专业术语学习

  • 1. 极差
  • 2. 方差
  • 3. 标准差
  • 4. 均值绝对差

1. 极差

数据统计的极差,又称全距,是指一组数据中最大值和最小值之差。

举个例子,如果我们有一组数据:1,2,3,4,5,那么这组数据的极差就是:

5 - 1 = 4

也就是说,这组数据中最大的数是5,最小的数是1,两者之差是4。

对于小学生来说,可以用以下例子来理解极差:

假设小明班上的同学身高分别是120厘米、130厘米、140厘米、150厘米、160厘米。那么,这组数据的极差就是:

160 - 120 = 40

也就是说,小明班上同学最高的是一个160厘米的男孩,最矮的是一个120厘米的女孩,两者之差是40厘米。

从这个例子可以看出,极差可以用来衡量一组数据的离散程度。如果极差较大,说明数据分布较为分散;如果极差较小,说明数据分布较为集中。

在实际生活中,极差也有很多应用场合,例如:

  • 衡量考试成绩的离散程度
  • 衡量产品质量的离散程度
  • 衡量经济指标的离散程度
    等等。

2. 方差

数据统计的方差,是用来衡量一组数据离散程度的度量。它反映了数据分布中各个数据点与平均数之间的差距有多大。

举个例子,假设我们有一组数据:1,2,3,4,5。那么,这组数据的平均数是3。

如果这五个数据都离平均数很近,比如都是2、3、4、4、5,那么这组数据的方差就比较小。

如果这五个数据离平均数很远,比如是1、5、9、13、17,那么这组数据的方差就比较大。

对于小学生来说,可以用以下例子来理解方差:

假设小明班上有10个同学,他们的身高分别是1米60、1米70、1米80、1米90、1米100。那么,这10个同学的平均身高是1米75。

如果这10个同学的身高都比较接近平均身高,比如都是1米70左右,那么这组数据的方差就比较小。

如果这10个同学的身高差距比较大,比如有个同学只有1米60,有个同学却有1米90,那么这组数据的方差就比较大。

从这个例子可以看出,方差可以用来衡量一组数据的离散程度。如果方差比较小,说明数据分布比较集中,数据比较接近平均数。如果方差比较大,说明数据分布比较分散,数据离平均数比较远。

在实际生活中,方差也有很多应用场合,例如:

  • 用于衡量经济指标的稳定性
  • 用于衡量产品质量的一致性
  • 用于衡量实验结果的可靠性
    等等。

3. 标准差

数据统计的标准差是指一组数据的分散程度。它是用来衡量数据的离散程度。标准差越大,数据越分散;标准差越小,数据越集中。

举个例子,如果我们有一组数据:1,2,3,4,5,那么这组数据的标准差是1.41。

在这里插入图片描述

这意味着,这组数据的平均值是3,但数据分散在平均值的周围。有些数据比平均值高,有些数据比平均值低。

如果我们有一组数据:2,2,2,2,2,那么这组数据的标准差是0。

这意味着,这组数据的所有数据都是相同的,因此没有分散。

对于小学生来说,可以用以下例子来理解标准差:

假设小明身高是150厘米,小红身高是155厘米,小华身高是160厘米。那么,这三人的身高平均值是155厘米。

标准差可以用来衡量这三人身高的分散程度。如果标准差较大,那么这三人身高的差异就较大。如果标准差较小,那么这三人身高的差异就较小。

在这种情况下,小明身高比平均值低5厘米,小华身高比平均值高5厘米。因此,这两人的身高与平均值的差距较大,标准差也较大。

而小红身高与平均值的差距较小,因此标准差也较小。

从这个例子可以看出,标准差可以用来衡量数据的离散程度。

在实际生活中,标准差也有很多应用场合,例如:

  • 衡量考试成绩的差异
  • 衡量产品质量的一致性
  • 衡量经济指标的波动性
    等等。

4. 均值绝对差

数据统计的均值绝对差,也称为平均绝对偏差,是指一组数据与其平均值之差的绝对值的平均数。它是用来衡量数据的离散程度的另一种方法。

举个例子,如果我们有一组数据:1,2,3,4,5,那么这组数据的均值绝对差是1.2。

这意味着,这组数据的平均值是3,但数据分散在平均值的周围。有些数据比平均值高,有些数据比平均值低。

假设我们有5个学生的考试成绩:
小明:90分
小红:80分
小刚:70分
小楠:85分
小青:95分

首先,我们计算出这5个数字的平均数(算术平均数):
(90 + 80 + 70 + 85 + 95) / 5 = 84

然后,计算每个数字与平均数的差值的绝对值:
|90 - 84| = 6
|80 - 84| = 4
|70 - 84| = 14
|85 - 84| = 1
|95 - 84| = 11

最后,把这些绝对差值求平均数,就得到了均值绝对差:
(6 + 4 + 14 + 1 + 11) / 5 = 7.2

所以这个例子中的均值绝对差是7.2。

均值绝对差反映了数据与平均值的偏离程度,它比标准差对异常值不那么敏感,可以更好地反映数据的真实分散程度。

在实际生活中,均值绝对差也有很多应用场合,例如:

  • 衡量考试成绩的差异
  • 衡量产品质量的一致性
  • 衡量经济指标的波动性
    等等。

与标准差相比,均值绝对差的优点是它不受极端值的影响。例如,如果我们将一组数据中的最大值和最小值都增加100,那么标准差也会增加,但均值绝对差不会增加。

未完待续!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/823207.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

main参数传递、反汇编、汇编混合编程

week03 一、main参数传递二、反汇编三、汇编混合编程 一、main参数传递 参考 http://www.cnblogs.com/rocedu/p/6766748.html#SECCLA 在Linux下完成“求命令行传入整数参数的和” 注意C中main: int main(int argc, char *argv[]), 字符串“12” 转为12,可以调用atoi…

大数据Doris(四十五):物化视图选择最优

文章目录 物化视图选择最优 物化视图选择最优 下面详细解释一下第一步最优物化视图是被如何选择出来的。 这里分为两个步骤: 对候选集合进行一个过滤。只要是查询的结果能从物化视图数据计算(取部分行,部分列,或部分行列的聚合)出都可以留在候选集中,过滤完成后候选集合…

山西电力市场日前价格预测【2023-12-28】

日前价格预测 预测说明: 如上图所示,预测明日(2023-12-28)山西电力市场全天平均日前电价为814.30元/MWh。其中,最高日前电价为1500.00元/MWh,预计出现在08:00~08:45,17:00~20:15。最低日前电价为394.61元/…

C#的checked关键字判断是否溢出

目录 一、定义 二、示例: 三、生成: 一、定义 使用checked关键字处理溢出。 在进行数学运算时,由于变量类型不同,数值的值域也有所不同。如果变量中的数值超出了变量的值域,则会出现溢出情况,出现溢出…

2023第三届中国高效大数据挑战赛A题思路及代码

一、题目介绍 赛题 A 中文文本纠错 中文文本纠错的任务主要是针对中文文本中出现的错误进行检测和纠正,属 于人工智能自然语言处理的研究子方向。中文文本纠错通常使用的场景有政务公 文、裁判文书、新闻出版等,中文文本纠错对于以中文作为母语的使用者…

nodejs+vue网上书城图书销售商城系统io69w

功能介绍 该系统将采用B/S结构模式,使用Vue和ElementUI框架搭建前端页面,后端使用Nodejs来搭建服务器,并使用MySQL,通过axios完成前后端的交互 系统的主要功能包括首页、个人中心、用户管理、图书类型管理、图书分类管理、图书信…

启动springboot时报错 APPLICATION FAILED TO START 包冲突

启动springboot时报错 APPLICATION FAILED TO START 包冲突 problem 具体日志如下 *************************** APPLICATION FAILED TO START ***************************Description:An attempt was made to call a method that does not exist. The attempt was made fr…

集群部署篇--Redis 主从模式

文章目录 前言Redis 主从部署:1.1 主从架构 介绍:1.2 主从架构 实现:1.2.1 redis 安装: 1.3 主从架构优缺点:1.4 故障转移: 总结 前言 显然在线上环境中 Redis 服务不能以单机的方式运行,必须有…

竞赛保研 基于卷积神经网络的乳腺癌分类 深度学习 医学图像

文章目录 1 前言2 前言3 数据集3.1 良性样本3.2 病变样本 4 开发环境5 代码实现5.1 实现流程5.2 部分代码实现5.2.1 导入库5.2.2 图像加载5.2.3 标记5.2.4 分组5.2.5 构建模型训练 6 分析指标6.1 精度,召回率和F1度量6.2 混淆矩阵 7 结果和结论8 最后 1 前言 &…

RAID卡

目录 一、RAID概述 二、常见类型 (一)RAID 0 (二)RAID 1 (三)RAID 5 (四)RAID 6 (五)RAID 10 (六)总结 三、创建RAID &…

几代WiFi有什么差异,它们有什么区别

最典型的差异指标:单流传输速率 第一代 基于的标准: 802.11 使用频率:2.4GHz 单流最大传输速率:2Mbit/s 第二代 基于的标准: 802.11b 使用频率:2.4GHz 单流最大传输速率:11Mbit/s 第三代 …

新版 macos下安装python 2.7 python 3.x多版本简单方法 pyenv python多版本管理工具

在新版本的macos中已经将默认的python升级成了3.x , 今天介绍一个简单的方法在新版本的macos中快速安装 python 2.7的方法, 就是使用brew安装python版本管理工具 pyenv来安装python2.7 # 安装pyenv版本管理工具 brew install pyenv # 安装python2.7 可以安装多个版本的ptyhon…

论文阅读——Slide-Transformer(cvpr2023)

Slide-Transformer: Hierarchical Vision Transformer with Local Self-Attention 一、分析 1、改进transformer的几个思路: (1)将全局感受野控制在较小区域,如:PVT,DAT,使用稀疏全局注意力来…

Linux:apache优化(3)—— 页面缓存时间

作用:通过 mod_expires 模块配置 Apache,使网页能在客户端浏览器缓存一段时间,以避免重复请求,减轻服务端工作压力。启用 mod_expires 模块后,会自动生成页面头部信息中的 Expires 标签和 CacheControl 标签&#xff0…

利用 IntelliJ IDEA 整合 GitHub 实现项目版本控制与协作管理

目录 前言1 设置GitHub登录账号2 将项目分享到GitHub3 IntelliJ IDEA 中导入Github项目4 往GitHub推送代码4.1 Commit Change(提交到本地库)4.2 Git -> Repository -> Push(推送到远程库) 5 拉取远程库代码到本地6 克隆远程…

08-React路由(Router 6版本)

Router5和Router6的变化 部分标签产生了变化,之前的标签都有了替(主要集中在Route匹配上),所以这里先回顾一下Router5,同时引出Router6的一些新特性 其次,React官方在推出Router6之后,就明确推…

【linux】Linux管道的原理与使用场景

Linux管道是Linux命令行界面中一种强大的工具,它允许用户将多个命令链接起来,使得一个命令的输出可以作为另一个命令的输入。这种机制使得我们可以创建复杂的命令链,并在处理数据时提供了极大的灵活性。在本文中,我们将详细介绍Li…

Python新手教程 —— Hello, World!

文章目录 Hello, World!作者自述关于本系列什么是编程语言什么是Python安装Python运行Python3解释器IDLE编写代码文件 本文复习Python技术资源分享1、Python所有方向的学习路线2、学习软件3、入门学习视频4、实战案例5、清华编程大佬出品《漫画看学Python》6、Python副业兼职与…

力扣刷题记录(22)LeetCode:714、300、674

714. 买卖股票的最佳时机含手续费 直接分析状态&#xff1a; 1.持有股票 可以是持续上一次持有股票的状态可以是买入当前股票 2.不持有股票 可以是持续上一次不持有股票的状态可以是卖出当前股票 class Solution { public:int maxProfit(vector<int>& prices, i…

轻松调整视频时长,创意与技术的新篇章

传统的视频剪辑工具往往难以精确控制时间&#xff0c;而【媒体梦工厂】凭借其先进的算法和界面设计&#xff0c;让视频时长的调整变得简单而精确&#xff0c;助你释放无限的创意&#xff0c;用技术为你的创意插上翅膀&#xff0c;让每一秒都有意义。 所需工具&#xff1a; 一…