Linux——进程间通信:管道
我们在开发过程中,可能会碰到两个或多个进程需要协同进行,这两个进
程之间有着一定的关系,这个进程可能会需要另一个进程的某些消息来达
到自己的目的,或者是一个进程控制着另一个进程,又或者是需要某种资
源的共享。但是我们知道进程具有独立性,进程是不可能直接将自己的资
源交给其他进程的。所以就会有进程间通信,它是通过不同进程间能看到
同一份资源,通过这份资源来实现进程资源的传输等等进程间操作。所以
今天就由我来介绍进程间通信的其中一种方式:管道。
进程间通信是操作系统中让进程间具有:数据传输、资源共享、通知事件、进程控制的功能,那既然是功能,就会有很多种方式,下面的管道是其中一种方式。
a. 管道是什么?
我们在使用shell的时候,有时候会使用这样的命令:
而中间的符号就是管道的意思,我们知道ps是一个命令,那它就是一个进程,gre也是一个进程,首先ps axj命令把系统中运行的进程都要准备打印到屏幕上,但是显然它没有,而是把这份资源通过管道传输给grep这个进程,而grep进程接收到这份资源后,进行过滤出有关bash的进程再输出到屏幕上。
在这其中ps和grep是两个进程,但是ps把它产生的资源给了grep进程。而他们中间的传输数据用到的就是管道。
而进程间通信的本质也是如此:通过让不同的进程能够看到同一份资源,而这份资源通常由操作系统提供。
b. 匿名管道
而管道又分为匿名管道和命名管道,上面的命令行中的管道我们可以看到它是没有名字的,它就是匿名管道,而这是命令行的匿名管道,我们代码中的匿名管道是什么呢?
这就收我们使用到的接口,他的大致意思是当我们使用这个接口的时候需要传入一个大小两个整形的数组为输出型参数,然后,这个数组中会存入两个被不同方式(读和写)打开的同一个管道文件fd。
那现在我们该如何实现不同进程间通信呢?
可以看到我们的打印是由父进程进行的,但是数据是由子进程提供的。这样就实现了进程间通信。
c. 匿名管道的原理
而上述进程间通信则是利用了操作系统创建子进程的特点,我们在创建子进程的同时,子进程会继承父进程的内核数据结构,进程pcb、文件描述符表等等都会被继承(拷贝)下来,所以子进程和父进程的进程描述符表中能看到同一个文件结构体指针,也就能看到同一份文件。
pipe这个接口就只是以读和写的方式打开了同一个文件,然后返回两个结构体的指针下标。
这个时候我们创建子进程,则这两个文件fd也会被子进程看到,假如我们要让子进程写(输出数据),父进程(读)接收数据,则需要子进程关闭文件的读端(关闭以写方式打开的文件fd),父进程关闭写端。形成信道。要让子进程接收数据,父进程输出数据的话反过来就可以。
需要注意的是,这个被打开的文件,就是管道文件,这个文件也是内存级文件,也就是使用pipe接口时,操作系统会在内存中创建一个内存级文件,供进程使用。
上面说了,使用pipe后会以不同方式打开同一个文件,而文件被打开主要部分有三个:文件结构体,文件页缓冲区,文件的读写方法集。在这里我们就要明确一点,当一个进程以不同方式(读和写)打开一个文件的时候,内存中只会有一个该文件的页缓冲区,读写方法集,但是会有两个文件结构体,因为在文件上读和写,它们的位置大概率会不同。所以是会有两个文件结构体:
有人会提出疑问,为什么要关闭父子进程的某个读写呢?不关闭不是双向通信了吗?
其实这是为了管道文件的实现的简便,如果支持双向通信的话,识别页缓冲区的数据就得需要分辨是哪个进程需要接收或者是哪个进程发出的,如果是多个消息挤在一起会很麻烦,所以管道通信是单向的。如果想要实现双向通信可以使用两个管道。
以上我们让父子两个进程看到了同一份资源(管道文件),从而能够使父子进程实现进程间通信。那既然父子间能够通过管道文件通信,那么两个子进程能不能实现通信呢?一个进程的父进程和它的子进程能不能实现通信呢?显然是可以的,都是利用了操作系统创建子进程的特点。但是如果是两个毫不相关的进程呢?通过这样的方式可以实现进程间通信吗?那就不行了。所以:匿名管道适用于拥有“血缘关系”的进程。
d. 匿名管道的特点
我们首先让写端一直写入数据但是不读:
可以看到,当我们只写不读时,当我们写到一定程度,就不会再写了,这其实是缓冲区已经满了。我们可以通过代码来查看它这个缓冲区有多大,具体方法是让它一次写入一字节:
而65535是63KB。那说明我这个Linux系统中的匿名管道文件的缓冲区大小是63KB。
如果是只写不读呢?
负责读的父进程则会一直阻塞在read函数。
现在我们试着关闭写端:
读端会一直读到零。
如果关闭写端呢?
这里我们直接让父进程退出,但是子进程可没有退出。所以我们会得出,当读端关闭时,写端也会直接关闭。
而这里的写端进程关闭是被操作系统使用13号信号杀掉的,我们可以通过回收子进程得知:
所以我们会总结出匿名管道的四种情况:
如果管道中没有了数据,读端要一直等待。
如果管道写满了数据,则必须等读端读走数据,直到有空间写入。
写端关闭,读端的read函数会返回0。
读端关闭时,写端进程会关闭。
e. 命名管道
既然有匿名管道,那就有命名管道。
命名管道和匿名管道的原理基本一样,我们会先使用mkfifo命令创建一个管道文件:
现在我们使用一下这个文件:
当我们向这个文件写入时:
光标会直接卡住,需要我们在另一个渠道将文件中的内容读出来。
这也是命名管道在命令行中的使用方式
命名管道它本质上还是一个内存文件,它不会将数据存储到磁盘中。这里的文件名也只是作为内存文件的一种映射。这个文件的存在是为了实现进程间通信的。下面我们来看看代码的命名管道怎么使用:
它的原理基本上与匿名管道一致。而命名管道就可以进行毫不相关的进程间的通信,只要两个进程中以一个读一个写的方式打开命名管道文件就可以实现进程间通信。因为路径是唯一的,我们可以使用路径+文件名的方式让不同进程看到同一份资源。