MySQL之索引(1)(索引概念与作用、红黑树、b树、b+树)(面试高频)

目录

一、索引的概念、作用。

(1)介绍。

(2)为啥索引能优化sql查询?

1、某张表(emp)结构以及数据如下。

2、假如执行的SQL语句为:select * from emp where empno=7844;

3、对比与总结。

(3)索引特点。(表格)

(4)常见索引结构。

(5)索引小总结。

二、常见的数据结构。

(1)数组(线性表的一种)。

(2)链表。

(3)二叉搜索树。

(4)平衡二叉搜索树。

(5)红黑树。(也是二叉搜索树的一种)

(6)B树。(B-Tree)

(7)B+树。(更详细的下篇博客学习)


一、索引的概念、作用。

(1)介绍。
  • 索引(index)是帮助MySQL高效获取数据数据结构(有序的数据结构)。
  • 在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
  • 索引类似于书籍的目录,它允许数据库系统无需扫描整个表即可找到记录。

(2)为啥索引能优化sql查询?
1、某张表(emp)结构以及数据如下。


2、假如执行的SQL语句为:select * from emp where empno=7844;
  • 普通表结构。无索引情况!


  • 有索引情况!如果针对于这张表建立了索引。

  • 假设索引结构就是二叉树,那么也就意味着,会对empno这个字段建立一个二叉树的索引结构。(关于数据结构可以往下看!)


3、对比与总结。
  • 当对指定字段(empno)添加了"二叉树"索引。此时我们在进行查询时,只需要扫描几次就可以找到数据了,极大的提高的查询的效率
  • 注意:这里我们只是假设索引的结构是二叉树,介绍一下索引的大概原理,只是一个示意图,并不是索引的真实结构。关于索引的真实结构,后面会详细介绍。

(3)索引特点。(表格)
  • 使用索引的优势与劣势。
优势劣势
提高数据检索的效率,降低数据库的IO成本。(因为没有索引,就会进行全表扫描,查询时一条一条比较次数就会很多,IO成本大)索引列也是要占用空间的。索引需要单独利用空间存储
通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。(例如mysql是B+树,是一个平衡多叉搜索树索引大大提高了查询效率。同时却也降低更新表的速度, 如对表进行INSERT、UPDATE、DELETE时,效率降低。

(4)常见索引结构。
  • MySQL的索引是在存储引擎层实现的
  • 不同的存储引擎有不同的索引结构,主要包含以下几种。
索引结构描述
B+Tree索引最常见的索引类型,大部分引擎都支持 B+ 树索引
Hash索引底层数据结构是用哈希表实现的, 只有精确匹配索引列的查询才有效, 不支持范围查询
R-tree(空间索引)空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少。(经、纬度)
Full-text(全文索引)是一种通过建立倒排索引,快速匹配文档的方式。类似于Lucene,Solr,ES

  • 上述是MySQL中所支持的所有的索引结构。再来看看不同的存储引擎对于索引结构的支持情况

  • 注意: mysql中平常所说的索引,如果没有特别指明,都是指B+树结构组织的索引

索引InnoDBMyISAMMemory
B+tree索引支持支持支持
Hash索引不支持不支持支持
R-tree索引不支持支持不支持
Full-text索引5.6版本之后支持支持不支持

(5)索引小总结。
  • 索引有关的作用——避免"慢sql"——>进行sql查询的优化。
  • 索引是一种帮助MySQL高效获取数据的数据结构(如:数组、链表、二叉树、红黑树、b树、b+树、图...)

  • 给表中的某一个列或多列——>加一个索引,就是给它加一种"数据结构"。
  • 当需要根据这个数据去查询时,不是先去查询表,而是先根据这个数据的数据结构快速定位需要的数据。这样它的比较效率就高了——>查询效率变高。

  • 但是当某个字段或多个字段添加了索引时,虽然查询效率增加,但它的增、删、改效率可能会降低。例如新增数据时,除了往表里增加数据,还要根据其数据结构添加其索引。删除数据时,还要删除其对应的索引。
  • 所以当某张表的查询需求多,就增加索引。如果增、删、改需求多,就不推荐添加索引

  • MySQL如果不指明使用的索引——那就是B+树索引结构。
  • MySQL的索引是在存储引擎层实现的。
  • 不同的存储引擎对于索引结构的支持是不同的。

二、常见的数据结构。

  • ArrayList、Linkedlist都是List接口的实现类。
(1)数组(线性表的一种)。
  • ArrayList是一种常见的集合。
  • ArrayList底层实现——长度可变的数组(线性表的一种)。
  • 查询效率较快,但是增、删、改效率较低

(2)链表。
  • Linkedlist底层实现——链表(双向循环链表)。
  • 查询效率较低、增删、改效率较高


(3)二叉搜索树。
  • 二叉搜索树(Binary Search Tree,BST)
  • 进一步优化查询结构——二叉搜索树(左子节点<根<右子节点)
  • 正常情况时的查询比较次数变少了。

  • 若添加数据都是有序的,就会退化成链表了。查询的比较次数回到链表状态。

(4)平衡二叉搜索树。
  • 继续优化——>无论怎么添加,都会自己通过旋转,保证左右子树的高度最多差1。
  • 平衡二叉搜索树(Balanced Binary Search Tree,BBST)是一种特殊的二叉搜索树。
  • 在保持二叉搜索树所有特性的同时,还保证了树的平衡性。平衡性是指树中任意两个叶子节点之间的最大深度差不超过1。这种平衡性确保了树的操作(如查找、插入、删除)都能在对数时间复杂度内完成,即O(log n)。

  • 缺点是各个子节点的移动旋转较为消耗资源。
(5)红黑树。(也是二叉搜索树的一种)
  • 继续优化。各个节点变成红色或黑色。
  • 平衡变成——>到任意一个节点所经过的黑色节点个数平衡。

  • 主要通过旋转和变色进行平衡。但是相较于普通的平衡二叉搜索树消耗资源更少。
  • 红黑树仍然是一个二叉搜索树,即对于任意节点,其左子树中的所有节点的值都小于该节点的值,其右子树中的所有节点的值都大于该节点的值。
  • 红黑树需要满足以下性质。
  • <1>每个节点要么是红色,要么是黑色。
  • <2>根节点是黑色。
  • <3>每个红色节点的两个子节点都是黑色(从每个叶子到根的所有路径上不能有两个连续的红色节点)。
  • <4>从任一节点到其每个叶子的所有简单路径都包含相同数目的黑色节点


  • 问题如下。随着元素的大量增多,如何降低树的高度??

  • 如果随着元素的增多,那么树的高度也会增加。因为2的n(n:树的高度)次方-1=当前树高最多能拥有的元素。太高的树,且子节点只有两个,则当数据量大时,缺陷又体现出来了。如果将一个树的根节点能拥有子节点扩大数量,那么就可以"压缩"树了。

  • 所以又产生了"B树"与"B+树"。

(6)B树。(B-Tree)
  • B树(B-Tree)是一种自平衡的树数据结构,它能够保持数据有序,并且允许进行搜索、顺序访问、插入和删除操作。
  • B树特别适用于存储在存储介质(如硬盘)上的数据集合,因为它可以减少磁盘I/O操作的次数。
  • 在插入和删除操作中,B树可能会进行节点的分裂合并以保持树的平衡
  • 当插入一个新键值时,如果节点未满,直接插入。如果节点已满,则节点分裂,并将中间的键值提升到父节点

  • B-Tree,B树是一种多叉路平衡查找树。
  • 相对于二叉树,B树每个节点可以有多个分支,即多叉
  • 以一颗最大度数(max-degree)为5(5阶)的b-tree为例,那这个B树每个节点最多存储4个key(值),5 个指针。如下。

  • 5阶代表5个指针。也就是根节点上的4个key(值)左右的5个指针。

  • 还是一样的左边比根节点小,右边比根节点大。


  • 举例4阶B树。(根节点4个指针、3个key(值))
  • 当元素添加不足4个时,不会分裂。

  • 满足4个元素时。中间大小的元素往上。
  • 这样就让树的高度就被"压缩"了。

(7)B+树。(更详细的下篇博客学习)
  • B+Tree是B-Tree的变种,我们以一颗最大度数(max-degree)为4(4阶)的b+tree为例,来看一下其结构示意图。

  • 蓝色框框起来的部分,是索引部分,仅仅起到索引数据的作用,不存储数据。

  • 红色框框起来的部分,是数据存储部分,在其叶子节点中要存储具体的数据。


与普通的B树相比较,主要有三种区别:

  • 所有的数据都会出现在叶子节点

  • 叶子节点形成一个单向链表

  • 非叶子节点仅仅起到索引数据作用,具体的数据都是在叶子节点存放的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/9781.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

pytest+request+allure接口自动化框架搭建分享

介绍分享一个接口自动化框架搭建方法 (pytestrequestallure)&#xff0c;这个方案是由 xpcs 同学在TesterHome社区网站的分享。 写在前面 去年11月被裁&#xff0c;到现在还没上岸&#xff0c;gap 半年了。上岸无望&#xff0c;专业技能不能落下&#xff0c;花了两三天时间&…

Linux之gdb的收尾部分

Linux之gdb的收尾部分 gbc常见指令的使用 gdb的调试

数据冒险-add x1, x1, x2 add x1, x1, x3 add x1, x1, x4

第一张图没有传递机制 竞争情况分析 读后写&#xff08;RAW&#xff09;竞争&#xff1a;当某条指令需要读取一个寄存器的值&#xff0c;而该寄存器的值尚未被前面的指令写入时&#xff0c;就会发生这种竞争。 指令2&#xff08;dadd r1, r1, r3&#xff09;依赖于指令1&#…

[产品管理-61]:马斯洛需求层次与产品的情感化设计

目录 一、概述 1、马斯洛需求层次理论概述 2、产品情感化设计与马斯洛需求层次的关系 3、产品情感化设计的实践案例 二、马斯洛需求层次与用户情感程度&#xff08;本能、行为、反思&#xff09;的关系 1、马斯洛需求层次与用户情感程度概述 2、马斯洛需求层次与用户情感…

浮动路由:实现出口线路的负载均衡冗余备份。

浮动路由 Tip&#xff1a;浮动路由指在多条默认路由基础上加入优先级参数&#xff0c;实现出口线路冗余备份。 ip routing-table //查看路由表命令 路由优先级参数&#xff1a;越小越优 本次实验测试两条默认路由&#xff0c;其中一条默认路由添加优先级参数&#xff0c;设置…

一阶 RC 低通滤波器实验方案

一阶 RC 低通滤波电路采用 RC 串联电路&#xff0c;把 R 或 C 做为负载端&#xff0c;对负载端与输入端的信 号做比较得到电路的特性曲线。图 1 所示 RC 串联电路构成一个双口网络&#xff0c; 根据图 1&#xff0c;其负载端开路时电容电压对输入电压的转移电压比为 这是一个…

华为私有接口类型hybrid

华为私有接口类型hybrid Tip&#xff1a;hybrid类型&#xff0c;简称混合型接口。 本次实验模拟2层网络下 vlan10 vlan20 不能互访&#xff0c;vlan10 vlan20 同时可以访问vlan100 sw1配置如下&#xff1a; <Huawei>sy [Huawei]sys sw1 [sw1]vl ba 10 20 100 [sw1]int…

006— 爬取第一考试网试题

import requests import logging import parsel import re import os#京东异步加载的反爬要求提供origin的信息 headers {user-agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0}lo…

【分布式】分布式锁设计与Redisson源码解析

分布式锁 分布式锁是一种在分布式计算环境中用于控制多个节点&#xff08;或多个进程&#xff09;对共享资源的访问的机制。在分布式系统中&#xff0c;多个节点可能需要协调对共享资源的访问&#xff0c;以防止数据的不一致性或冲突。分布式锁允许多个节点在竞争访问共享资源…

【架构设计常见技术】

EJB EJB是服务器端的组件模型&#xff0c;使开发者能够构建可扩展、分布式的业务逻辑组件。这些组件运行在EJB容器中&#xff0c;EJB将各功能模块封装成独立的组件&#xff0c;能够被不同的客户端应用程序调用&#xff0c;简化开发过程&#xff0c;支持分布式应用开发。 IOC …

万字长文深度解读Movie Gen技术原理(5部曲):图像视频联合生成模型 (2)

​引言 简介 图像和视频基础模型 时间自编码器(TAE) 训练目标 骨干架构 文本嵌入和视觉-文本生成 空间上采样 模型扩展和训练效率 预训练 预训练数据 训练 微调STF 微调数据集创建 监督微调&模型平均 推理 推理提示重写 提高推理效率 评估 评估维度 评估基准…

基于MATLAB的农业病虫害识别研究

matlab有处理语音信号的函数wavread&#xff0c;不过已经过时了&#xff0c;现在处理语音信号的函数名称是audioread选取4.wav进行处理&#xff08;只有4的通道数为1&#xff09; 利用hamming窗设计滤波器 Ham.m function [N,h,H,w] Ham(fp,fs,fc)wp 2*pi*fp/fc;ws 2*pi*…

KEIL编译后直接生成bin文件

KEIL编译后直接生成bin文件 fromelf --bin -o "$LL.bin" "$LL.axf"表示在“与axf相同的文件夹”下生成bin文件。

解析广告联盟的玩法、功能及注意事项

广告联盟是一种商业模式&#xff0c;通过联合多个站点或平台&#xff0c;共同向广告商提供广告展示和推广服务。在这篇文章中&#xff0c;我将重点介绍什么是广告联盟&#xff0c;广告联盟的玩法、功能及注意事项&#xff0c;帮助商业模式策划师更好地了解和应用该模式。 一、…

GitHub中搜索项目方法

0 Preface/Foreword 1 搜索方法 1.1 项目介绍 如上截图&#xff0c;一个项目包含的基本信息&#xff1a; 项目名项目简介项目介绍Watch数量&#xff0c;接收邮件提醒Star数量&#xff0c;关注&#xff0c;subscribeFork数量&#xff0c;在repo中创建分支 1.2 限定项目名查找…

基于java+SpringBoot+Vue的洗衣店订单管理系统设计与实现

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; Springboot mybatis Maven mysql5.7或8.0等等组成&#x…

简述kafka集群中的Leader选举机制

Kafka 集群中有一个 broker 的 Controller 会被选举为 Controller Leader&#xff0c;负责管理集群broker 的上下线&#xff0c;所有 topic 的分区副本分配和 Leader 选举等工作。 Controller 的信息同步工作是依赖于 Zookeeper 的。 &#xff08;1&#xff09;创建一个新的 t…

OpenGl绘制了一个雪人

#include <GL/glut.h> #include <math.h>const int n 1000; int q; //圆的半径 int m, p;//圆心 const GLfloat R 0.5f; const GLfloat Pi 3.1415926536f;//初始化OpenGL void init(void) {glClearColor(0.0f, 0.0f, 0.0f, 0.0f);//设置背景颜色glShadeModel(G…

Golang进阶

1.面向对象 1.1.golang语言面向对象编程说明 Golang 也支持面向对象编程(OOP)&#xff0c;但是和传统的面向对象编程有区别&#xff0c;并不是纯粹的面向对象语言。所以我们说 Golang 支持面向对象编程特性是比较准确的。Golang 没有类(class)&#xff0c;Go 语言的结构体(st…

kafka面试夺命连环三十问(上篇)

1、kafka消息发送的流程&#xff1f; 在消息发送的过程中&#xff0c;涉及到两个线程--main线程和sender线程。在main线程中创建了一个双端队列RecordAccumulator。main线程将消息发送给RecordAccumulator&#xff0c;然后sender线程不断从双端队列RecordAccumulator 拉取消息发…