基尼指数（Gini Impurity）的理解和计算

基尼指数（Gini Impurity）的理解和计算

news/2024/11/5 19:44:04/文章来源:https://blog.csdn.net/m0_48587622/article/details/143373861

基尼不纯度简介 - Gini Impurity - 吕汉鸿 - 博客园

先看上面这个博文！！！然后再看下面的，下面这个原博文有一点问题。已修正，修正后的完整内容如下

一、基尼指数的概念

基尼指数（Gini不纯度）表示在样本集合中一个随机选中的样本被分错的概率。

注意：Gini指数越小表示集合中被选中的样本被分错的概率越小，也就是说集合的纯度越高，反之，集合越不纯。当集合中所有样本为一个类时，基尼指数为0.

二、基尼指数的计算公式

基尼指数的计算公式为：

以下excel表格记录了Gini指数的计算过程。

以第一个Giniimpurity 0.364139008为例

Positive的gini：p*(1-p)+q*(1-q) = 0.729*(1-0.729) + 0.270 * (1-0.270) = 0.394 因为p+q=1，即p^2+q^2

Giniimpurity = 加权基尼

= [ positive数量/（positive+negative）数量 ] * 0.394 + [ negative数量/（positive+negative）数量 ] * 0.336

= 144/303* 0.394 + 159/303* 0.336 = 0.3635 约等于0.364数据精度

我们可以看到，GoodBloodCircle的基尼指数是最小的，也就是最不容易犯错误，因此我们应该把这个节点作为决策树的根节点。在机器学习中，CART分类树算法使用基尼指数来代替信息增益比，基尼指数代表了模型的不纯度，基尼指数越小，不纯度越低，特征越好。这和信息增益（比）相反。

基尼指数（Gini Impurity）的理解和计算-CSDN博客

这个图同样的原理。

28 【机器学习入门｜5分钟理解决策树算法 - 躺平学ML | 小红书 - 你的生活指南】 😆 0SneRzSkoY8CzN5 😆

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/1555.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

《股市行情预测软件：开发之路的探索与挑战》

《股市行情预测软件：开发之路的探索与挑战》

《股市行情预测软件：开发之路的探索与挑战》一、股市行情预测软件的重要性二、开发所需技术（一）数据收集与处理技术（二）数据分析技术（三）算法选择与应用（四）编程语言与开…

阅读更多...

整合全文检索引擎 Lucene 添加站内搜索子模块

整合全文检索引擎 Lucene 添加站内搜索子模块

整合全文检索引擎 Lucene: 添加站内搜索子模块 1. 什么是 Lucene ? 有啥优势？ Lucene 是一个开源的全文检索引擎库，由 Apache 基金会维护，官网地址：https://lucene.apache.org/ 。它提供了丰富的文本处理和搜索功能&#xff0c…

阅读更多...

OceanBase详解及如何通过MySQL的lib库进行连接

OceanBase详解及如何通过MySQL的lib库进行连接

OceanBase详解及如何通过MySQL的lib库进行连接一、引言二、OceanBase概述1. 起源与发展2. 核心技术特点3. 应用场景三、OceanBase架构解析1. 系统架构2. 存储引擎3. 分布式架构四、如何使用MySQL的lib库连接OceanBase1. 前提条件2. 安装MySQL Connector/C3. 编写连接代码4. 编…

阅读更多...

104. UE5 GAS RPG 实现技能火焰爆炸

104. UE5 GAS RPG 实现技能火焰爆炸

这一篇文章我们再实现一个技能火焰爆炸，由于我们之前已经实现了三个玩家技能，这一个技能有一些总结的味道，对于创建技能相同的部分，长话短说，我们过一遍。准备工作我们需要一个技能类，继承于伤害技能基…

阅读更多...

【力扣打卡系列】验证二叉搜索树

【力扣打卡系列】验证二叉搜索树

坚持按题型打卡&刷&梳理力扣算法题系列，语言为go，Day17 验证二叉搜索树题目描述解题思路前序遍历：先访问节点值，再访问左右子树有效二叉搜索树的定义节点的左子树只包含小于当前节点的数节点的右子树只包含大于当前节…

阅读更多...

Swarm-LIO: Decentralized Swarm LiDAR-inertial Odometry论文翻译

Swarm-LIO: Decentralized Swarm LiDAR-inertial Odometry论文翻译

文章目录前言一、介绍二、相关工作三、方法A. 问题表述B. 框架概述C. 群体系统的初始化D. 去中心化激光雷达-惯性状态估计四. 实验A. 室内飞行B. 退化环境飞行C. 去中心化部署五. 结论和未来工作前言原文：原文准确的自我状态和相对状态估计是完成群体任务的关…

阅读更多...

京东毫秒级热key探测框架JD-hotkey

京东毫秒级热key探测框架JD-hotkey

前言对任意突发性的，无法预先感知的热点数据，包括热点数据（如突发大量请求同一个商品）、热用户（如恶意爬虫刷子）、热接口（突发海量请求同一个接口）等，一瞬间打到我们的服…

阅读更多...

IntelliJ IDEA 中上传项目到 Gitee 的完整指南

IntelliJ IDEA 中上传项目到 Gitee 的完整指南

博主主页:【南鸢1.0】本文专栏：git 目录简介 1.插入intellij-gitee 2.导入下载插件 3.选择导航栏中的VCS->Share Project on Gitee 4.登录gitee 6.验证gitee仓库是否创建成功 7.上传分享项目 8.验证仓库代码是否上传成功总结简介 Gitee 是一个代码…

阅读更多...

低代码可视化-按钮open-type开放能力自定义-代码生成器

低代码可视化-按钮open-type开放能力自定义-代码生成器

微信小程序原本确实不直接支持通过点击按钮将内容分享到朋友圈的功能，但微信在后续更新中逐步放开了部分限制，允许特定内容以小程序卡片的形式分享到朋友圈。然而，这一功能仍然需要满足一定的条件，并且需要开发者进行特定的配置。…

阅读更多...

基于springboot乐器视频学习网站设计与实现（源码齐全可用）

基于springboot乐器视频学习网站设计与实现（源码齐全可用）

项目描述临近学期结束，还是毕业设计，你还在做java程序网络编程，期末作业，老师的作业要求觉得大了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等。你想解决的问题，今天给大家介绍…

阅读更多...

TypeScript：never 类型的神奇妙用

TypeScript：never 类型的神奇妙用

在 TypeScript 中，never 是一个特殊类型，表示「永不存在的值类型」，通常用于表示不可能发生的情况。它适用于抛出异常、不返回值的函数或处理逻辑上永远不会出现的分支。以下是它的简单用法和注意事项： 1. never 的用法 1、抛…

阅读更多...

Redis-结构化value对象的类型

Redis-结构化value对象的类型

文章目录一、Redis的结构化value对象类型的介绍二、Redis的这些结构化value对象类型的通用操作查看指定key的数据类型查看所有的key判断指定key是否存在为已存在的key进行重命名为指定key设置存活时间pexpire与expire 查看指定Key的存活时间为指定key设置成永久存活三、Redis…

阅读更多...

解密美国 VPS 主机的核心优势与未来发展

解密美国 VPS 主机的核心优势与未来发展

在全球网络需求不断增长的今天，许多企业和开发者都在寻找更灵活、安全、性能优异的主机解决方案。美国 VPS 主机凭借其强大的技术支持和广泛的网络连接，成为国际用户的热门选择。本文将深入探讨美国 VPS 主机的核心优势、其在网络应用上的独特表现&#…

阅读更多...

XSS小游戏【1-13关】

XSS小游戏【1-13关】

第一关 Payload：<script>alert(1)</script> 第二关 Payload：keyword<script>alert(1)</script> 发现没有成功，F12发现需要闭合input 标签再次输入payload：aaa"><svg οnlοadalert(1)> …

阅读更多...

Spring Boot框架：校园社团信息管理的现代化解决方案

Spring Boot框架：校园社团信息管理的现代化解决方案

3系统分析 3.1可行性分析通过对本校园社团信息管理系统实行的目的初步调查和分析，提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性本校园社团信息管理系统采用SSM框架，JAVA作…

阅读更多...

uniapp推送配置流程

uniapp推送配置流程

Dcloud Dcloud注册账号个推了解即可注册个推账号 ios配置流程需配置含有推送的描述文件以及p8证书配置推送证书 ios证书配置报技术错误（参数错误） TeamID-苹果开发者账号唯一的ID 安卓需配置多厂商小米手机需要配置小米厂商华为手机则需…

阅读更多...

JavaEE初阶---网络原理之TCP篇（二）

JavaEE初阶---网络原理之TCP篇（二）

文章目录 1.断开连接--四次挥手1.1 TCP状态1.2四次挥手的过程1.3time_wait等待1.4三次四次的总结 2.前段时间总结3.滑动窗口---传输效率机制3.1原理分析3.2丢包的处理3.3快速重传 4.流量控制---接收方安全机制4.1流量控制思路4.2剩余空间大小4.3探测包的机制 5.拥塞控制---考虑…

阅读更多...

单细胞数据分析（一）：10X数据生成seurat数据对象

单细胞数据分析（一）：10X数据生成seurat数据对象

文章目录介绍加载R包数据链接导入数据过滤细胞：移除双重细胞合并所有seurat数据对象输出结果系统信息介绍在单细胞基因组学研究中，Seurat是一个流行的R包，用于单细胞基因表达数据的分析和探索。以下是如何从10X基因注释数据生成Seurat数据对象，并对该数据进行过滤的步骤…

阅读更多...

了解SQLExpress数据库

了解SQLExpress数据库

SQLExpress（Microsoft SQL Server Express）是由微软公司开发的一款免费且轻量级的数据库管理系统。以下是关于SQLExpress的详细解释： 一、定义与特点定义： SQLExpress是Microsoft SQL Server的一个缩减版或基础版，旨在…

阅读更多...

C++ 魔法三钥：解锁高效编程的封装、继承与多态

C++ 魔法三钥：解锁高效编程的封装、继承与多态

快来参与讨论💬，点赞👍、收藏⭐、分享📤，共创活力社区。目录 💯前言 💯封装 1.封装概念 2.封装格式 3.封装的原理 4.封装的作用 💯继承 1.继承的概念 2.继承格式 3.继承的…

阅读更多...

最新文章