【Linux系统编程】第二十二弹---操作系统核心概念:进程创建与终止机制详解
✨个人主页: 熬夜学编程的小林
💗系列专栏: 【C语言详解】 【数据结构详解】【C++详解】【Linux系统编程】
目录
1、进程创建
1.1、fork函数重识
1.2、fork函数返回值
1.3、写时拷贝
1.4、fork常规用法
1.5、fork调用失败的原因
2、进程终止
2.1、进程退出场景
2.2、进程常见退出方法
1、进程创建
1.1、fork函数重识
进程 = 内核的相关管理数据结构(task_struct + mm_struct + 页表) + 数据和代码
在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。
#include <unistd.h>
pid_t fork(void);
返回值:子进程中返回0,父进程返回子进程id,出错返回-1
进程调用fork,当控制转移到内核中的fork代码后,内核做:
- 分配新的内存块和内核数据结构给子进程
- 将父进程部分数据结构内容拷贝至子进程
- 添加子进程到系统进程列表当中
- fork返回,开始调度器调度
当一个进程调用fork之后,就有两个二进制代码相同的进程。而且它们都运行到相同的地方。但每个进程都将可以开始它们自己的旅程,看如下程序:
#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
int main( void )
{
pid_t id;
printf("Before: pid is %d\n", getpid());
// id = fork 先创建进程并赋值,返回值为-1则创建失败,直接退出
if ( (id=fork()) == -1 )perror("fork()"),exit(1);
printf("After:pid is %d, fork return %d\n", getpid(), id);
sleep(1);
return 0;
}
运行结果
这里看到了三行输出,一行Before,两行After。进程6627(每次打印的pid都不同)先打印Before消息,然后它有打印After。另一个After消息有6628打印的。注意到进程6628没有打印before,为什么呢?如下图所示
所以,fork之前父进程独立执行,fork之后,父子两个执行流分别执行。注意,fork之后,谁先执行完全由调度器决定。
1.2、fork函数返回值
- 子进程返回0。
- 父进程返回的是子进程的pid。
为什么父进程返回的是子进程的pid,子进程返回的是0?
为了方便父进程对子进程进行标识,进而进行管理。
1.3、写时拷贝
通常,父子代码共享,父子在不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本。具体见下图:
1.4、fork常规用法
- 一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子进程来处理请求。
- 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数。
1.5、fork调用失败的原因
- 系统中有太多的进程
- 实际用户的进程数超过了限制
2、进程终止
进程终止是在做什么?
1、释放曾经的代码和数据所占据的空间。
2、释放内核数据结构。
2.1、进程退出场景
- 1、代码运行完毕,结果正确(可以通过进程的退出码决定)。
- 2、代码运行完毕,结果不正确(可以通过进程的退出码决定)。
- 3、代码异常终止。
异常:
程序运行的时候,崩溃了----操作系统发现你的进程做不了该做的事,OS杀掉了进程。一旦出现异常,退出码没有意义!!!
为什么出现异常?原因是什么?
进程出异常的本质是进程收到操作系统发给进程的信号!
我们可以看进程退出的时候,退出信号是多少,就能判断进程为什么异常了!!!
场景一:
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
printf("I am a process,pid:%d,ppid:%d\n",getpid(),getppid());
return 0;
}
运行结果
echo $? // 父进程bash获取到的最近一个子进程的退出码
场景二:
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
printf("I am a process,pid:%d,ppid:%d\n",getpid(),getppid());
return 100;// 返回100
}
运行结果
场景三(main函数内部异常):
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
int* p = NULL;
printf("I am a process,pid:%d,ppid:%d\n",getpid(),getppid());
*p = 100;// 对空指针进行解引用
return 0;
}
运行结果
场景四(使用信号命令):
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
while(1)
{
printf("I am a process,pid:%d,ppid:%d\n",getpid(),getppid());
sleep(1);
}
return 0;
}
运行结果
从场景三和场景四看到,都是报的段错误,证明两个的退出信号是一样的。
退出码所代表的意思是什么呢?通过一个程序来看看。
代码演示
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
#include<string.h>
int main()
{
for(int i=0;i<255;i++)
{
printf("%d :%s\n",i,strerror(i));// 打印退出码代表的意思
}
return 100;// 返回100
}
运行结果
除了系统的退出码之外,我们能不能自己编写一套退出码呢???
答案是可以的,下面我们通过一个除法函数来实现自己的退出码并打印错误信息。
代码演示一
#include<stdio.h>
int Div(int x,int y)
{
if(y==0)
{
return -1;
}
else
{
return x/y;
}
}
int main()
{
int result = Div(10,100);
printf("result:%d [%s]\n",result);
result = Div(10,0);
printf("result:%d [%s]\n",result);
return 0;
}
运行结果
从运行结果我们可以看到0一定是正常的运行结果,但是-1不能确定是正常运行,还是y等于0的时候的结果,为了知道是什么原因,我们可以自主编写一个错误码,并将错误码打印出来,具体代码如下:
优化
#include<stdio.h>
// 枚举常量
enum
{
Sucess = 0,
Div_zero,
Mod_zero,
};
int exit_code = Sucess;
const char* CodeToErrString(int code)
{
switch(code)
{
case Sucess:
return "Sucess";
case Div_zero:
return "Div_zero";
case Mod_zero:
return "Mod_zero";
default:
return "Unkown error";
}
}
int Div(int x,int y)
{
if(y==0)
{
// y等于0则设置退出码
exit_code = Div_zero;
return -1;
}
else
{
return x/y;
}
}
int main()
{
int result = Div(10,100);
printf("result:%d [%s]\n",result,CodeToErrString(exit_code));
result = Div(10,0);
printf("result:%d [%s]\n",result,CodeToErrString(exit_code));
return 0;
}
运行结果
通过运行结果我们可以清楚看到-1是除0错误。
结论:
衡量一个进程退出,我们只需要看两个数字:退出码和退出信号。
- 1、先确认是否异常。
- 2、不是异常,就一定是代码跑完了,看退出码即可。
2.2、进程常见退出方法
正常终止(可以通过 echo $? 查看进程退出码):
- 1. 从main返回
- 2. 调用exit
- 3. 调用_exit
异常退出:
- ctrl + c,信号终止
_exit函数
#include <unistd.h>
void _exit(int status);
参数:status 定义了进程的终止状态,父进程通过wait来获取该值
代码演示一
#include<stdio.h>
#include<unistd.h>
int main()
{
printf("hello linux\n");
_exit(-1);// 退出码为-1
return 0;
}
运行结果
说明:虽然status是int,但是仅有低8位可以被父进程所用。所以_exit(-1)时,在终端执行$?发现返回值是255。
代码演示二
#include<stdio.h>
#include<unistd.h>
void func()
{
_exit(12);// 不在main函数内部,照样会结束程序
}
int main()
{
printf("hello linux\n");
func();
return 0;
}
运行结果
_exit函数可以从任意函数中结束程序。
exit函数
#include <unistd.h>
void exit(int status);
_exit函数前面的两个演示与exit函数的效果是一样的,此处我们看看两者的区别。
代码演示
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
int main()
{
printf("hello linux");
sleep(2);
exit(2);
// _exit(2);
return 0;
}
运行结果
从上面的代码我们可以看到,exit函数会重刷缓冲区,_exit不会重刷缓冲区,具体细节如下图:
exit最后也会调用_exit, 但在调用_exit之前,还做了其他工作:
- 1. 执行用户通过 atexit或on_exit定义的清理函数。
- 2. 关闭所有打开的流,所有的缓存数据均被写入。
- 3. 调用_exit。
return退出
return是一种更常见的退出进程方法。执行return n等同于执行exit(n),因为调用main的运行时函数会将main的返回值当做 exit的参数。
代码演示
#include<stdio.h>
int main()
{
printf("hello linux\n");
return 1;
}
运行结果