Linux进程切换以及调度算法

目录

Linux进程切换以及调度算法

Linux进程切换介绍

前置知识

进程切换过程分析

调度算法

补充知识


Linux进程切换以及调度算法

Linux进程切换介绍

前面提到,分时操作系统下,CPU会在多个进程中做高速切换以实现多个进程看似同时执行的,但是问题是为什么CPU可以做到多个进程来回切换而不会影响每一个进程的执行,这就是进程切换需要思考的问题

基本认知:CPU切换进程是根据每一个进程对应的时间片决定切换的时间,一旦时间片到了,CPU就会切换到另一个进程,如此往复。所以,在上面的过程中,就会出现一些进程并没有执行完毕但是CPU进行了切换

前置知识

在CPU中,有许多寄存器,每一种寄存器对应着自己的功能:

  1. 通用寄存器(General-Purpose Registers)
    • 这些寄存器可以用于多种用途,如存储中间计算结果、指针或整数数据等
  2. 状态寄存器(Status Registers)标志寄存器(Flag Registers)
    • 存储条件码或其他状态信息,如零标志、进位标志、溢出标志等,这些标志常用于决定程序分支或中断处理
  3. 程序计数器(Program Counter, PC)
    • 也称为指令指针(Instruction Pointer),它指向当前正在执行或即将执行的指令的位置
  4. 指令寄存器(Instruction Register, IR)
    • 暂存当前正在执行的指令
  5. 地址寄存器(Address Registers)
    • 用于存储内存地址
  6. 数据寄存器(Data Registers)
    • 用于暂存从内存读取的数据或写入内存的数据
  7. 段寄存器(Segment Registers)
    • 在某些架构中用于存储内存段的基址
  8. 控制寄存器(Control Registers)
    • 用于配置处理器的工作模式和其他控制功能
  9. 链接寄存器(Link Registers)返回地址寄存器(Return Address Register)
    • 用于保存返回地址,通常在函数调用期间使用

例如,下面的图中展示了部分寄存器的作用:

每一个CPU有自己的一套寄存器,而每一套寄存器并不会在进程切换时保存每一个进程切换前的数据,而正在被调度的进程在CPU寄存器里面的瞬时数据也被称为上下文数据

进程切换过程分析

以下面的图为例:

当前CPU正在执行一个进程,假设现在继续出现一个新的进程如下,此时状态如下:

如果下一刻操作系统切换进程为进程2执行,就会出现下面的情况:

进程2因为要执行,导致进程1执行的记录被抹除,如果此时下一次进程1被切换为继续执行就会找不到上一次执行的数据,为了防止出现这种问题,在Linux中,每一个PCB结构中会存在一个TSS结构,该结构用于存储被切换前的最后一步对应的上下文数据

有了TSS结构,就可以实现每一次进程切换时,尽管CPU的寄存器中的数据被下一个寄存器抹除,但是下一次执行之前被切换的进程依旧可以从被切换的那一瞬间对应的数据开始继续执行,整体大致执行思路如下图所示:

Linux最初源码中的TSS结构:

struct tss_struct {long    back_link;    /* 16 high bits zero */long    esp0;long    ss0;        /* 16 high bits zero */long    esp1;long    ss1;        /* 16 high bits zero */long    esp2;long    ss2;        /* 16 high bits zero */long    cr3;long    eip;long    eflags;long    eax,ecx,edx,ebx;long    esp;long    ebp;long    esi;long    edi;long    es;        /* 16 high bits zero */long    cs;        /* 16 high bits zero */long    ss;        /* 16 high bits zero */long    ds;        /* 16 high bits zero */long    fs;        /* 16 high bits zero */long    gs;        /* 16 high bits zero */long    ldt;        /* 16 high bits zero */long    trace_bitmap;    /* bits: trace 0, bitmap 16-31 */struct i387_struct i387;
};

调度算法

在Linux中,前面提到了每一个进程PCB是用双向链表链接的,但是如果只是使用双向链表结构作为调度队列,那么CPU在每一次调度时都需要从前往后遍历链表,其时间复杂度就是$O(N)$。实际上,在操作系统下,如果一个算法的时间复杂度超过了$O(N)$就已经算效率比较低的,所以为了降低时间复杂度,在调度队列中,除了有双向链表外,还使用一个类似于哈希表的结构,而每一个进程PCB就是哈希桶的节点,哈希表结构示意图如下:

当用户创建一个进程后,就会链接到后面40个空间的其中一个空间下面,这里也就解释了为什么前面进程优先级部分NI值的区间为[-20, 19],一共40个可选值,而根据进程优先级的计算公式:PRI=初始PRI+NI,可以得出,进程优先级PRI的区间为[-60, 99],所以真实的链接位置下标计算公式可以理解为:进程优先级- 60 + 100

假设现在一个进程的优先级为61,则链接位置下标就是61-60+100=101,示意图如下:

对于调度进程来说,如果只有一个调度队列,那么势必会出现优先级高的因为下标较小而一直被先执行,优先级低的可能一直不会被执行,所以为了保证调度尽量公平调度,在Linux底层的运行队列存在着两个调度队列,并且结构相同,对应运行队列中的结构如下:

// task_t
typedef struct task_struct task_t;// prio_array_t
struct prio_array {int nr_active;unsigned long bitmap[BITMAP_SIZE];struct list_head queue[MAX_PRIO];
};
typedef struct prio_array prio_array_t;
// list_head
struct list_head {struct list_head *next, *prev;
};
// BITMAP_SIZE
#define BITMAP_SIZE ((((MAX_PRIO+1+7)/8)+sizeof(long)-1)/sizeof(long))
// MAX_PRIO
#define MAX_USER_RT_PRIO    100
#define MAX_RT_PRIO        MAX_USER_RT_PRIO#define MAX_PRIO        (MAX_RT_PRIO + 40)struct runqueue {// ...task_t *curr, *idle;// ...prio_array_t *active, *expired, arrays[2];// ...
};

runqueue结构中,curr即为前面提到过的head指针,idle即为前面提到的tail指针,本次主要关注prio_array_t类型的三个变量,分别代表CPU当前的调度队列结构、已经执行的进程所在的队列(过期队列)结构和包含两个调度队列结构的数组

prio_array_t本质是prio_array结构,以下是该结构的介绍:

prio_array结构中存在一个nr_active变量,该变量表示当前处于运行状态的进程数量,而bitmap是一个用于映射下标的数组,而queue即为调度队列,每一个queue元素即为一个有前驱指针和后驱指针的节点,MAX_PRIO即为140(前面提到的调度队列的大小),而BITMAP_SIZE通过计算后得到值为5

long类型在C语言中占4个字节,与 int类型一致

所以上面结构可以转化为下面的直观形式:

struct runqueue {// ...task_struct *curr, *idle;// ...prio_array *active, *expired, arrays[2];// ...
};struct prio_array {int nr_active;unsigned long bitmap[5];struct list_head queue[140];
};

下面是结构的简化图:

  • 关于activeexpire指针:

如果只有一个调度队列,那么就会出现因为优先级导致部分进程被调度后依旧会回到当前调度队列的同一位置,下一次CPU再调度,又会继续按照优先级先调度该进程,从而导致其他进程无法被调度,这个现象也被称为进程饥饿(Process Starvation)问题,所以就需要两个调度队列。在CPU调度进程时会调度active指针指向的arrays结构,此时被调度过的进程会从active指向的调度队列转移到expired指向的调度队列,如果active指针指向的arrays结构中的nr_active为0,则代表当前调度队列已经没有待调度的进程,此时expired指针的arrays结构中的nr_active一定不为0,所以此时再进行调度只需要交换active指针和expired指针的值即可实现active指针继续指向待被调度的进程所在的arrays结构,从而实现了每一个进程都被调度。

CPU调度进程的三种情况:

  1. 进程状态为终止状态:直接退出调度队列
  2. 到达时间片规定的时间:从active转移到expired
  3. 新进程:默认插入到expired,防止因为优先级过高导致其他进程尽管先产生还是后执行的情况
  • 关于bitmap映射数组下标:

使用bitmap目的是为了快速获取到queue数组中哪些位置有进程,基本思路如下:

在C语言中,long类型占4个字节,所以一共有32个二进制位,而bitmap数组的大小为5,所以有$5 \times 32 = 160$个二进制位,足以覆盖140个下标。因为有无进程刚好只有两个状态,所以用二进制表示再适合不过,对应的0在比特位中的位置表示对应的下标没有进程,1表示对应的下标有进程。如果bitmap的某一个元素为0,则其32个二进制位每一位一定为0,此时对应的调度队列下标一定没有进程,否则就代表存在进程,对应的判断方式如下:

for(int i = 0; i < 5; i++) {if(bitmap[i] == 0) {continue;}else {    // ...}
}

例如,在一个整数的二进制中,获取其中有多少个1的方法(统计一共多少个进程)如下:

while (x) {count++;x &= (x - 1);
}// 例如10
// 1010 & 1001 = 1000
// 1000 & 0111 = 0
// 此时count为2

上面的方法中,因为每一个进程所在的调度队列遍历是$O(1)$级别,获取每一个进程也是$O(1)$级别,所以在Linux中也被称为内核O(1)调度算法,这个算法是Linux 2.6.x版本中引入的算法,后来引入了 Completely Fair Scheduler (CFS),它是一种更加公平的调度算法,旨在为所有进程提供公平的 CPU 时间份额。CFS 已经成为现代 Linux 内核默认的调度算法之一,并且在许多方面优于O(1)调度算法

补充知识

每一个进程根据自己的状态不同会处于不同的队列,例如处于运行状态队列、处于等待队列等,为了保证可以在多个队列中,在Linux对应的进程PCB中不会直接使用双向链表的前驱指针和后继指针单独作为PCB的成员,而是将一个节点的结构作为成员,源码如下,其中list_head即为每一个节点的结构:

struct task_struct {// ...struct list_head run_list;// ...struct list_head tasks;struct list_head ptrace_children;struct list_head ptrace_list;// ...struct list_head children;    /* list of my children */struct list_head sibling;    /* linkage in my parent's children list */// ...
};

进程PCB在链接时示意图如下:

上面的结构不是直接链接下一个节点的地址,而是链接下一个节点的内部成员,这种做法最大的优势就是提供了更好的扩展性:当有多个节点结构时,就可以让当前进程PCB根据节点结构链接到对应的队列中。但是这种做法也有另外的问题:如果想通过当前PCB访问下一个PCB中的其他成员就不可以直接通过访问下一个PCB节点访问

对于上面的问题,提供解决思路:

因为可以访问到下一个PCB的节点结构,所以就获取到了下一个PCB中的节点地址,在C语言结构体中,结构体的成员对应的地址依次增大,对应的偏移量也在增大。利用这个特点,通过偏移量就可以获取到PCB的地址,再通过PCB的地址就可以访问每一个成员

以下面的结构为例:

#include <stdio.h>struct A {int a;char b;float c;double d;
};int main()
{struct A t;printf("&t = %p\n", &t);printf("a = %p\n", &(t.a));printf("b = %p\n", &(t.b));printf("c = %p\n", &(t.c));printf("d = %p\n", &(t.d));
}输出结果:
&t = 0x7ffd1ca8bc20
a = 0x7ffd1ca8bc20
b = 0x7ffd1ca8bc24
c = 0x7ffd1ca8bc28
d = 0x7ffd1ca8bc30

可以看到结构体起始地址与第一个成员的地址相同,假设现在只知道成员d的地址,那么想知道偏移量就必须知道结构体的起始地址,可以假设将0地址作为结构体A的起始地址,则有(struct A*)0,而通过这个方式获取d成员的地址就是&((struct A*)0->d),此时获取到的d成员的地址就是d相对于地址0的偏移量,有了偏移量,就可以通过实际d成员的地址减去偏移量计算出结构体A的实际起始地址,获得了结构体的起始地址就可以通过->访问到其他成员的地址,上面的过程综合在一起:

((struct A*)(&d - &(((struct A*)0)->d)))->其他成员// 定义成宏使其更有通用性
#define getStart(type, x) ((type*)(&x - &(((type*)0)->x)))

上面的过程中,之所以可以将0地址作为结构体A的起始地址,是因为尽管结构体A的起始地址不在0位置,但是0位置假设作为A类型的一个成员,只要不写入,编译器就不会报错,自然也不会有非法访问的情况。

在计算真实地址中的偏移量时,例如前面实际的地址中就是0x7ffd1ca8bc30(d的实际地址)-0x7ffd1ca8bc20(结构体A的起始地址)= 0x000000000010(是一个计算出的常量)。

现在假设结构体A的起始地址为0,而因为0x000000000010是一个不变的量,所以当结构体A的起始地址为0时,自然d的地址就变为了0x000000000010。此时000000000010-0x0x000000000000也是d在结构体A的起始地址为0时的偏移量,简化为0x000000000010。

使用d的实际地址减去偏移量就是0x7ffd1ca8bc30-0x000000000010=0x7ffd1ca8bc20,获取到的就是结构体A的实际起始地址。

整个过程中将0地址作为结构体A的起始地址就是为了方便计算出偏移量,因为本身并不知道结构体A的实际起始地址

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1549227.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

防伪溯源查询系统V1.0.5

多平台&#xff08;微信小程序、H5网页&#xff09;二维码扫码输码防伪溯源查询系统&#xff0c;拥有强大的防伪码生成功能&#xff08;内置多种生成规则&#xff09;、批量导出防伪码数据、支持代理商管理端&#xff08;可批量对自己防伪码进行操作处理&#xff09;、文章资讯…

【深度学习】(10)--ResNet残差网络

文章目录 ResNet残差网络1. 传统卷积神经网络的问题1.1 梯度消失和梯度爆炸1.2 退化问题 2. 解决问题2.1 梯度消失与爆炸2.2 退化问题 3. 残差结构结构归纳 4. BN&#xff08;Batch Normalization&#xff09; 总结 ResNet残差网络 ResNet 网络是在 2015年 由微软实验室中的何…

ComfyUI | 好用的人体 衣服分割工具-③-Layer Style | 超多实用功能 | 强烈推荐

这里为大家分享检测人体的脸部、五官、头发、手臂、腿、脚&#xff0c;上衣、裤子、背景的插件&#xff0c;能够生成出对应的蒙版mask&#xff0c;接入到ComfyUI中&#xff0c;用于后续处理&#xff0c;如局部重绘&#xff0c;换背景等。 &#xff08;需要相关插件的同学可自…

华为LTC流程架构分享

文末附LTC流程管理PPT下载链接~ 前面笔者分享了华为LTC流程相关PPT&#xff0c;应读者需求&#xff0c;今天从架构角度进行再次与读者共同学习下LTC流程架构。 华为LTC流程架构是一个全面且集成的业务流程体系&#xff0c;从线索发现开始&#xff0c;直至收回现金&#xff0c…

Transformer: Attention is all you need

Transformer于2017年提出&#xff0c;最开始应用于NLP领域&#xff0c;随着Transformer的快速发展&#xff0c;在视觉领域中也越来越多的论文或应用用到了Transformer&#xff0c;这里记录一下自己学习的一些知识点。 PDF&#xff1a; 《Attention Is All You Need》 Code: att…

08-Registry搭建docker私仓

08-Registry搭建docker私仓 Docker Registry Docker Registry是官方提供的工具&#xff0c;用于构建私有镜像仓库。 环境搭建 Docker Registry也是Docker Hub提供的一个镜像&#xff0c;可以直接拉取运行。 步骤&#xff1a; 拉取镜像 docker pull registry启动Docker R…

YOLOv5改进:Unified-loU,用于高品质目标检测的统一loU ,2024年8月最新IoU

💡💡💡现有IoU问题点:IoU (Intersection over Union)作为模型训练的关键,极大地显示了当前预测框与Ground Truth框之间的差异。后续研究者不断在IoU中加入更多的考虑因素,如中心距离、纵横比等。然而,仅仅提炼几何差异是有上限的;而且新的对价指数与借据本身存在潜在…

Codesys trace工具右键菜单框呼出异常的问题解决

这个问题困扰了好久&#xff0c;添加trace工具之后&#xff0c;一但在模型图位置右键后&#xff0c;整个codesys界面都无法呼出右键菜单&#xff0c;甚至会出现键盘输入失效的问题。 解决办法&#xff1a;更新trace工具 1、工具 —> CODESYS Installer 或者搜索CODESYS In…

【YOLO目标检测反光衣数据集】共2388张、已标注txt格式、有训练好的yolov5的模型

目录 说明图片示例 说明 数据集格式&#xff1a;YOLO格式 图片数量&#xff1a;2388 标注数量(txt文件个数)&#xff1a;2388 标注类别数&#xff1a;2 标注类别名称&#xff1a;reflective_clothes、other_clothes 数据集下载&#xff1a;反光衣数据集 图片示例 数据…

帕金森早期四大隐秘“预警灯“,你不可不知的健康警报!

在这个快节奏的时代&#xff0c;健康似乎成了我们最容易忽视却又最为宝贵的财富。今天&#xff0c;我们要揭开一个常被误解与忽视的医学领域——帕金森病。它不仅仅是老年人的专利&#xff0c;更可能在你我未曾留意的瞬间悄悄降临。了解帕金森早期的四个“信号”&#xff0c;就…

【反素数】

题目 思路 首先分析 的性质 一定是 中约数最大的一定是约数同是最大的数字中值中最小的进一步挖掘性质&#xff0c;紧贴枚举的做法 约数最大值最小&#xff08;也决定了层数、其它约束&#xff09;&#xff0c;是枚举的比较条件实现上述目的&#xff0c;枚举的质数种类在大小…

【文件增量备份系统】MySQL百万量级数据量分页查询性能优化

&#x1f3af; 导读&#xff1a;本文针对大数据量下的分页查询性能问题进行了深入探讨与优化&#xff0c;最初查询耗时长达12秒&#xff0c;通过避免全表计数及利用缓存保存总数的方式显著提升了浅分页查询速度。面对深分页时依然存在的延迟&#xff0c;采用先查询倒数第N条记录…

使用JLINK合并boot和app两个hex文件,使用Keil烧写到单片机

嵌入式产品开发&#xff0c;现在比较流行的是使用IAP方式对产品固件进行升级。只要应用到IAP升级方式&#xff0c;就不可避免的要开发boot和app两部分代码。 产品开发阶段可以分别将boot和app通过keil软件下载到单片机&#xff0c;但是产品量产阶段&#xff0c;如果还是分两次下…

微信占用空间太大,文件清理工具来了

今天分享几个安卓手机文件清理工具。 SD女佣 安卓经典系统清理利器&#xff0c;一键释放存储空间&#xff0c;能清理手机中的垃圾文件、临时文件和无用的应用程序数据&#xff0c;提升设备性能并节省存储空间&#xff0c;内置强大的文件浏览器&#xff0c;支持应用管理和系统…

代码随想录算法训练营第59天|卡码网 47. 参加科学大会、94. 城市间货物运输 I

1. 卡码网 47. 参加科学大会 题目链接&#xff1a;https://kamacoder.com/problempage.php?pid1047 文章链接&#xff1a;https://www.programmercarl.com/kamacoder/0047.参会dijkstra堆.html#总结 思路依然是 dijkstra 三部曲&#xff1a; 1.第一步&#xff0c;选源点到哪个…

Arthas sc(查看JVM已加载的类信息 )

文章目录 二、命令列表2.2 class/classloader相关命令2.2.5 sc&#xff08;查看JVM已加载的类信息 &#xff09;举例1&#xff1a;模糊搜索&#xff0c;xx包下所有的类举例2&#xff1a;打印类的详细信息举例3&#xff1a;打印出类的Field信息 二、命令列表 2.2 class/classlo…

分享了一个支持WIN7的QGIS3.34的版本

上传分享了一个支持WIN7的QGIS3.34的版本&#xff0c;该版本同时也是个轻量级的QGIS&#xff0c;大小轻便、启动速度也快&#xff01;但该版本没有Python及Python插件支持。 需要在WIN7下使用或只使用QGIS3.34核心基本功能的可以使用这个&#xff01;当然这个版本也支持WIN7以上…

ARM 汇编5 数据类型

在ARMv7-M处理器中&#xff0c;Byte对应8bits&#xff0c;Halfword对应16bits, Word对应32bits。 而在展示中&#xff0c;我们通常会使用一位来表示4bits&#xff0c;也就是 1 nibble 4 bits 如下图&#xff0c;一个寄存器中包含8 nibbles&#xff0c;也就是32bits。 关于…

python基础库

文章目录 1.研究目的2.platform库介绍3.代码4.结果展示 1.研究目的 最近项目中需要利用python获取计算机硬件的一些基本信息,查阅资料,.于是写下这篇简短的博客,有问题烦请提出,谢谢-_- 2.platform库介绍 platform 库是 Python 的一个内置库&#xff0c;可以让我们轻松地获取…

SpringBoot教程(安装篇) | Docker Desktop的安装(Windows下的Docker环境)

SpringBoot教程&#xff08;安装篇&#xff09; | Docker Desktop的安装&#xff08;Windows下的Docker环境&#xff09; 前言如何安装Docker Desktop资源下载安装启动&#xff08;重点&#xff09;加入汉化包 设置加速镜像 前言 如果你在 Windows 上&#xff0c;确保 Docker …