深入解析Linux轻量级进程:线程的概念、原理、优缺点及其与进程的关系与区别

🍑个人主页:Jupiter.
🚀 所属专栏:Linux从入门到进阶
欢迎大家点赞收藏评论😊

在这里插入图片描述

在这里插入图片描述

目录

    • `📚Linux线程`
      • `📕什么是线程`
            • *可以使用多进程去并发的执行一个进程的代码,那为什么要由线程呢?*
            • *线程的原理的简单介绍*
            • *Linux为什么要这么设计线程?*
      • `⚡再谈进程地址空间`(页表,虚拟地址和物理地址)
            • *多个执行流是如何进行代码划分的?*
          • `页表`
            • *虚拟到物理地址如何转换的,以及页表最终结构*
      • `🍑线程的优点 `
      • `🌳线程的缺点`
      • `🌲线程异常 `
      • `🐕线程用途 `
      • `🍒Linux进程VS线程`
      • `🚲进程和线程`


📚Linux线程

📕什么是线程

在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的执行分支”,是CPU调度的基本单位。

进程是加载到内存中的程序,进程=内核数据结构+进程代码和数据
一切进程至少都有一个执行线程。

线程在进程内部运行,本质是在进程地址空间内运行

在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就形成了线程执行流。

一个进程的代码是由无数个函数构成,或则说是由我无数个代码块构成,每一个代码块都有对应的入口地址,这些代码块在一个进程中都是串行调用的

可以使用多进程去并发的执行一个进程的代码,那为什么要由线程呢?
  • 在Linux系统中,为了让一个进程的代码能够并行去执行,可以使用多进程,但是创建一个新的进程,会创建进程PCB,进程地址的空间,页表,文件描述符表,加载程序,构建映射等等,这个成本是很高的,总:进程创建成本是较高的(时间和空间成)。
  • 我们的目的是多执行流并发执行一个进程的代码,提高效率,那有没有可以不用使用多进程来实现这一目的呢?这就要引出Linux线程了。
线程的原理的简单介绍
  • 线程和进程类似,只不过不需要像创建进程那样创建全部的内核数据结构,线程的创建只需要创建一个task_struct,并且该task_struct指向该进程的进程地址空间。这样地址空间以及地址空间上的资源都是多个线程共享的,将进程的代码划分为多个区域,那么就可以创建多个线程去并发的执行这几个区域的代码。
    在这里插入图片描述
  • 这就可以理解线程进程内部的一个执行分支的概念了,内部:线程是在进程的地址空间中运行的,线程是CPU调度的基本单位,CPU在调度的时候,不用区分看到的task_struct是一个进程还是一个进程中的一个执行流。
Linux为什么要这么设计线程?
  • 因为如果我们要设计线程,OS也会对线程做管理,所以也得设计线程的结构体(线程控制块struct TCB)进行描述,再利用数据结构进行组织起来,并且需要自己的调度算法等等,这样设计非常复杂,并且可以发现 线程和进程 的很多字段很类似,所以,Linux的设计者认为,进程和线程都是执行流,具有极度地相似性,没必要单独设计数据结构和算法,直接使用进程模拟线程。
  • 但是Windows系统中,是对于进程和线程是分开设计的,都有自己独特的一套数据结构和算法。

在Linux中,没有实际上的线程,因为是使用进程模拟的线程,所以再Linux中,线程是叫轻量级进程

  • Linux中,所有的调度执行流都叫做:轻量级进程

如果一个进程执行的代码是一个操作系统,就是一个内核级虚拟机的技术。

⚡再谈进程地址空间(页表,虚拟地址和物理地址)

多个执行流是如何进行代码划分的?
  • 操作系统也是需要管理内存的,实际上,内存是被划分为很多个以4KB为单位的内存块,一个可执行程序,是以平坦模式进行整体编址的,不仅要编址,并且按照地址也被划分为一个一个的4KB的数据块(写入文件系统就是一个一个的4Kb数据块了,文件按系统部分讲过,这里不赘述),所以内存与磁盘进行交互数据,都是以4KB数据块为单位进行交互的。其中,内存是空间,磁盘上是内容,所谓的加载,就是将内容放在空间中,在OS系统的术语,把4KB的空间和内容叫做页框或者页帧
  • OS要对划分的4KB内存块进行管理,用struct page的结构体进行描述(如下图),其中包含一个标记为,标记该内存块的状态(是否正在被使用,是属于用户级还是内核级等等),再利用一个struct page类型的数组进行管理(大小就是该内存被划分为的4KB的内存块数目),下标就标识了一个唯一的内存块,所以对内存的管理就是对该数组的增删查改。
页表
虚拟到物理地址如何转换的,以及页表最终结构

OS会将虚拟地址看成 10 10 12个比特位为大小的子区域(如下图):
10个比特位的取值范围:0~1023
12个比特位的取值范围为0~4096(4KB)

  • 操作系统中有一张页目录,最多可以存放1024张页表(实际中不可能),页表里面存放的是页框的物理地址(内存被划分的每一个 内存块的起始地址)。

  • 其中,根据虚拟地址的前10个比特位标识在哪一个页表中,中间10个比特位标识在哪一个页框中,最后12个比特位标识在该页框(内存块)中的偏移量(页内偏移)。

  • 其中,页表后面还可以加上一些权限标志位,如内核态,用户态,读写权限等。

  • 给不同的线程划分不同的代码执行的区域,本质就是让不同的线程,各自看到页表全部的子集。

🍑线程的优点

  • 创建一个新线程的代价要比创建一个新进程小得多

  • 与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多(面试题

  • 在CPU中会存在一个硬件,叫cache,在进行调度一个进程的时候,CPU中除了会有一组寄存器存放临时变量外,OS还会将当前执行的代码中附近的代码预先加载到cache中,所以CPU在寻址访问代码的时候,不用从内存中读取,直接在cache中读取,从而提高CPU寻址的效率。

  • 所以如果是进程间切换,不仅要保存各自的上下文数据,切换CPU中寄存器的数据等等,在cache中曾经缓存的数据全部失效了,另一个进程只能重新加载数据进cache,这个过程耗时,但是如果是线程切换,在cache中曾经缓存的数据就不需要丢弃,因为预加载的代码数据线程可能还会使用。

  • 线程占用的资源要比进程少很多

  • 能充分利用多处理器的可并行数量

  • 在等待慢速I/O操作结束的同时,程序可执行其他的计算任务

🌳线程的缺点

  • 性能损失
    • 一个很少被外部事件阻塞的计算密集型线程往往无法与其它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是增加了额外的同步和调度开销,而可用的资源不变。
  • 健壮性降低
    • 编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的,换句话说线程之间是缺乏保护的。
  • 编程难度提高
    • 编写与调试一个多线程程序比单线程程序困难得多。

🌲线程异常

  • 单个线程如果出现除零野指针问题导致线程崩溃,进程也会随着崩溃。
  • 线程是进程的执行分支,线程出异常,就类似进程出异常,进而触发信号机制,终止进程,进程终止,该进程内的所有线程也就随即退出。

🐕线程用途

  • 合理的使用多线程,能提高CPU密集型程序的执行效率
  • 合理的使用多线程,能提高IO密集型程序的用户体验(如生活中我们一边写代码一边下载开发工具,就是多线程运行的一种表现)

🍒Linux进程VS线程

🚲进程和线程

  • 进程是资源分配的基本单位
  • 线程是调度的基本单位
  • 线程共享进程数据,但也拥有自己的一部分数据:
    • 线程ID
    • 一组寄存器(一组线程执行的上下文数据)
    • 栈(存放执行的函数的临时变量)
    • errno
    • 信号屏蔽字
    • 调度优先级
  • 进程的多个线程共享 同一地址空间,因此Text SegmentData Segment 都是共享的,如果定义一个函数,在各线程中都可以调用,如果定义一个全局变量,在各线程中都可以访问到,除此之外,各线程还共享以下进程资源和环境:
    • 文件描述符表
    • 每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
    • 当前工作目录
    • 用户id和组id

进程和线程的关系如下图:


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1522506.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

搭子小程序开发,让社交更加有趣

如今,搭子成为了年轻人社交的新兴方式,它作为一种连接年轻人的社交纽带,深受大众的欢迎!各式各样的旅游搭子、健身搭子、游戏搭子等,让年轻人享受到社交的魅力。 随着互联网的发展,寻找搭子也发展到了线上…

一个好用的Maven依赖冲突解决插件:Maven Helper

在项目开发,或项目Maven需要新增依赖、项目依赖组件升级时,经常会出现添加后,因为各个模块中有相同的依赖、不同的版本而导致依赖冲突,从而导致项目启动不起来,这种冲突非常恶心,因为是传递依赖所以会看不出…

Hackme靶场渗透攻略

步骤一,注册登录进去 步骤二,点击search 我们发现有很多书 步骤三,搜索一本书抓包发放到重放器 步骤四,数据改为1*,复制数据包到1.txt,然后打开sqlmap 步骤五,sqlmap查看当前数据库 python s…

多模态AI:原理、应用与未来展望

随着人工智能技术的飞速发展,多模态AI逐渐成为构建智能系统的重要方向。传统的AI系统通常依赖于单一模态的数据,如文本、图像或音频。而多模态AI通过结合多种数据类型,能够在更复杂的场景下提供更智能的解决方案。本文将深入探讨多模态AI的原…

Android 11 (R)AMS Activity内部机制

一、AMS是如何被管理的 如我们在Android 11(R)启动流程中介绍的一样,AMS和ATMS是在SystemServer中被启动的 ActivityTaskManagerService atm mSystemServiceManager.startService(ActivityTaskManagerService.Lifecycle.class).getService(); mActivityManagerSe…

使用vscode debug cpp/python混合编程的程序(从python调用的C++编译的dll)

使用vscode debug cpp/python混合编程的程序(从python调用的C编译的dll) 1. 安装插件 Python C Debugger https://marketplace.visualstudio.com/items?itemNamebenjamin-simmonds.pythoncpp-debug 2. 在.vscode/launch.json中增加配置 拷贝自 https:…

默默的学python——两个重要的函数dir()、help()

一、dir()函数 dir()函数在Python中用于返回一个对象的所有属性和方法的列表,当你对一个函数使用dir()时,它会返回函数对象的所有可访问的属性和方法的名字列表。 具体的说,dir()函数获取的内容包括: 1.特殊方法和魔法方法 如…

Kettle 锁表原因及解决办法【源码级分析】

文章目录 背景源码分析锁表场景1:资源库锁表锁表场景2:写日志锁表在哪里配置的kettle_log_table?官方解释自增 SQL 获取 BatchI 原理解决自增 SQL 获取 BatchID背景 Kettle 7.1.0 经常出现锁表的情况,体现为在数据库里有一条锁表 SQL,然后整个 Kettle 都无法运行。😂�…

App推广新姿势:Xinstall一键下载唤起,轻松提升用户体验!

在App推广和运营的道路上,你是否遇到过这样的困扰:用户点击下载链接后,却无法直接唤起App,导致用户体验不佳,甚至造成用户流失?别担心,今天我们就来科普一个神器——Xinstall,它能帮…

【GIT】idea中实用的git操作,撤回commit,撤回push、暂存区使用

IDEA中最常见的UI操作:【GIT】Idea中的git命令使用-全网最新详细(包括现象含义) 文章目录 问题一: idea撤回仅commit错误的代码(仅本地仓库,因为还没推送到远程)问题二: idea撤回Com…

8个优质视频素材库,商用无忧

如果你正在寻找一些优质的视频素材库,不妨看看以下这些网站。它们提供了各种各样的视频素材,无论是用于家庭视频制作、Vlog、还是社交媒体内容,都能找到合适的素材。从生活日常到创意动画,这些网站都能帮你找到想要的视频素材。一…

学习react day01

(1)nodejs.cn 中文网 版本须较新 (2)全局安装 npm install create-react-app -g ( 版本查询 create-react-app -V) (3)创建app create-react-app test-app (4&…

5 - ZYNQ GPIO

文章目录 1 GPIO基本概念1.1 MIO-EMIO简介1.2 MIO-EMIO连接1.3 MIO-EMIO路由1.4 MIO-EMIO配置 2 GPIO控制寄存器2.1 输入/输出控制寄存器2.2 中断控制寄存器2.3 中断触发设置 3 GPIO在Vivado SDK中的使用 1 GPIO基本概念 在ZYNQ中,GPIO(General Purpose…

读取obj文件中的vt并转成需要的uv数据

先展示效果图 适用场景:加载的obj模型需要发生形变,同时还要展示模型的纹理效果,可以使用到面料模拟或者弹性物体的模拟当中 具体实现方案: 1、读取obj文件中的vt的值,存起来 2、读取f值,存v索引和vt索引 3…

宿舍|基于SprinBoot+vue的宿舍管理系统(源码+数据库+文档)

宿舍管理系统 基于SprinBootvue的私人诊所管理系统 一、前言 二、系统设计 三、系统功能设计 系统功能实现 后台模块实现 管理员功能实现 学生功能实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍&…

文件包含PHP伪协议利用方法

1.file://协议 使⽤: file:// ⽂件的绝对路径和⽂件名 2.php?cmdfile://D:\phpstudy_pro\WWW\123.txt 2.php://filter协议 ⽤途:常⽤于读取⽂件 / 源码 2.php?cmdphp://filter/readconvert.base64-encode/resource1.php 3.php://input协议 步骤一&…

软考报名临近尾声,接下来干什么?附最新软考报名进度表

软考2023年下半年的报名虽然仅仅过半,但是除了北京之外,其他地区均已经可以报名,而且为数不少的地区已经结束了报名,我相信绝大多数地区的考生应该已经完成了报名,所以从这个意义上讲,软考的报名的确是临近…

sql-labs41-45关通关攻略

第41关 一.查询数据库 http://127.0.0.1/Less-41/?id-1%20union%20select%201,2,database()--http://127.0.0.1/Less-41/?id-1%20union%20select%201,2,database()-- 二.查表 http://127.0.0.1/Less-41/?id-1%20union%20select%201,2,(select%20group_concat(table_name)…

HTB-sequal(mysql)

前言 各位师傅大家好,我是qmx_07,今天给大家讲解sequal这台靶机 渗透过程 信息搜集 服务器开放了3306mysql端口思路:mysql爆破-sC参数会执行 相关的默认脚本 连接mysql数据库 通过空密码连接道mysql数据库flag:7b4bec00d1a39…

本地缓存和分布式缓存有何区别?

缓存是提高服务性能的一把利剑,尤其在高并发、高请求量的服务中性能提升明显。如果后端服务只靠关系型数据库提供支撑,系统会很快达到处理瓶颈。缓存设计无处不在,通常来说可以分为本地缓存与分布式缓存。本地缓存框架主要有Guava cache、Caf…