当前位置：首页 > article >正文

Linux——进程概念

article 2025/2/21 3:36:19

什么是操作系统

操作系统管理各种计算机硬件、为应用程序提供基础、并且充当计算机硬件与用户之间的中介。

冯诺依曼体系

在这里插入图片描述
这里的存储器指的是内存不考虑缓存情况，这里的CPU能且只能对内存进行读写，不能访问外设(输入或输出设备)外设(输入或输出设备)要输入或者输出数据，也只能写入内存或者从内存中读取。

举例:使用printf输出hello world在计算机内部是如何执行的，首先，键盘上编写C语言文件，然后再载入到内存中运算器和控制器对该文件进行处理(忽略处理细节，然后再执行C语言文件把hello world输出到屏幕上

操作系统如何对软硬件资源进行管理:

操作系统对硬件做管理一句话–先数据结构再算法，对软硬件资源建立数据结构模型，再对该模型设计算法实现管理

如何理解进程?

在多道程序环境下，允许多个程序并发执行，此时它们将失去封闭性，并具有间断性及不可再现性的特征。为此引入了进程的概念，以便更好地描述和控制程序的并发执行，实现操作系统的并发性和共享性

间断性:并发程序具有“执行-暂停–执行”这种间断性的活动规律。
失去封闭性:多个程序共享系统中的资源，这些资源的状态将由多个程序来改变，致使程序之间相互影响。
不可再现性:在初始条件相同的情况下，程序的执行结果依赖于执行的次序。程序执行的结果不确定。如何理解？在windows中你用的软件运行起来都叫进程，你将一张图片发给的好友a,这是你使用软件的结果，这个结果取决于你。而不是取决于程序。
并发性：多个进程在一个CPU下采用进程切换的方式，在一段时间之内，让多个进程都得以推进，称之为并发

PCB(Process Conctrl Block)

可以简单理解为一个记录进程属性的集合(是一个C语言结构体)
举例:使用printf输出hello world在计算机内部是如何执行的，首先，键盘上编写C语言文件，然后再载入到内存中运算器和控制器对该文件进行处理(忽略处理细节)，然后再执行C语言文件把hello world输出到屏幕上，现在多一个hello linux的程序。会怎么样去执行。
先简单的讲述一下：首先，会对两个程序生成两个对应的PCB结构体，并且里面包含我们编写的代码和数据（如何连接、存储暂不深究），所以一个进程 = PCB + 该进程代码和数据。这样操作系统才可以分辨出那个是hello world，hello linux。以及执行后续操作。
在这里插入图片描述
注意：在linux中的PCB被定义为task_struct，他不是单纯的一种结构，而是多种结构嵌合，这里先理解为链式结构

查看进程

Linux中的/proc目录中存放着每一个进程目录和内核文件
Linux系统中查看父进程ID，进程ID，进程组ID，会话ID的方法：ps ajx
我们可以输入ps ajx指令看到对应进程的pid(每一个进程独有的id,相当于他们的身份证号码)
在这里插入图片描述

PID：进程ID，是Linux操作系统用来唯一标识一个进程的数字。
PPID：父进程ID，表示创建当前进程的父进程的ID。
PGID：进程组ID，表示该进程所属的进程组的ID。
SID：会话ID，表示该进程所属的会话的ID。一个会话可以包含多个进程组，而一个进程组只能属于一个会话。
TTY：终端类型，表示该进程是在哪个终端上运行的。如果进程是在后台运行的，这个字段可能显示为 ?。
TPGID：前台进程组ID，如果该进程是在前台运行的，这个字段表示该进程所属的前台进程组的ID。
STAT：状态，表示进程的当前状态。常见的状态（后面进程状态会讲）
TIME：CPU时间，表示该进程占用CPU的总时间。
COMMAND：命令，表示启动该进程的命令行。PID：进程ID，是Linux操作系统用来唯一标识一个进程的数字。

每一个进程关闭后，重新开启，得到的PID是与之前的PID不一致
当程序作为进程开始执行时，会在/proc 文件夹中新建一个目录,目录的名字为该进程的PID，在该文件夹中会有两个快捷方式(暂时这么理解) exe和cwd,exe->可执行程序 cwd->当前进程的工作目录–这也解释了之前在C语言阶段中，使用fopen函数时，为什么会自动生成文件在该目录一样，是因为在进程中记录了该路径，该路径也被称为当前进程的工作路径
在这里插入图片描述
这里的PID是程序在运行时，在进程中对应的ID，每一次重启ID都会产生不同的ID号
这里的PPID该进程的父进程，本质是bash(什么是bash?)–(bash是shel1的一种，shel1:是一个程序用于给用户与操作系统内核进行交互的接口，它允许用户输入命令，执行程序，操作文件和目录，以及管理系统资源)
我们每一次打开xshell写指令的时候，我们的系统会给我创建bash进程，因为bash是用于对操作系统交互的接口，所有的指令、程序的父进程都是bash,只负责命令行解释给操作系统(翻译官)，每一个指令或自己写的程序都是子进程，执行出问题的时候只会影响子进程。

如何创建进程？

使用fork函数创建子进程，使用./可执行文件，或者使用bash指令即可创建进程(创建进程可以理解为运行程序)

fork函数

在这里插入图片描述
Q1:为什么fork要给子进程返回0，给父进程返回子进程pid?
返回不同的返回值是为了区分不同的执行流，执行不同的代码,而且子进程是要被父进程管理的，他结束了要告诉父进程他结束了，不然会导致成为僵尸进程（在后面进程状态中会讲到）
Q2:一个函数是如何做到返回两次的?如何理解?
在fork函数内部实现了创建子进程，因为父子进程的代码是共享的，我们就可以像旁边的那里一下对id做if然后实现返回两个不同的值
Q3:fork函数，究竟在干什么?
1.进程 = 内核数据结构 +代码和数据
2.fork()函数后的代码是共用的在下面共用的代码中肯定有同名定义的变量，其实对于这些变量而言，系统会对他们做写时拷贝，只有子进程用到的时候才会对该数据做写时拷贝，为子进程创建多一份
在这里插入图片描述