当前位置：首页 > article >正文

Linux之【网络I/O】前世今生（一）

article 2025/2/12 6:32:21

在 Linux之【磁盘I/O】前世今生一文中，我们介绍了文件I/O 的细节。本文将继续介绍网络I/O的内容。

一、基本概念

介绍网络I/O前，先了解一些基本概念。

1.1、上下文

CPU 寄存器，是CPU内置的小容量、速度极快的内存。程序计数器，是用来存储 CPU 正在执行的指令位置、或者即将执行的下一条指令位置。二者是 CPU 在运行任何任务时，必须依赖的环境，记为上下文。

1.2、上下文切换

运行新的任务时需把当前任务的上下文（也就是CPU寄存器和程序计数器）保存起来，然后加载新任务的上下文到这些寄存器和程序计数器中，最后再跳转到程序计数器所指的新位置，运行新任务。

所以执行不同的程序，即进程切换时会发生上下文切换，线程切换也一样。

操作系统和用户程序是两个不同的程序，前者运行在内核态，后者运行在用户态，所以，内核态和用户态的切换一定会发生上下文切换，进程从用户态到内核态的转变，需要通过系统调用（调用操作系统）来完成。系统调用的过程，会发生CPU上下文的切换。

CPU 寄存器里原来用户态的指令位置，需要先保存起来。接着，为了执行内核态代码，CPU 寄存器需要更新为内核态指令的新位置。最后才是跳转到内核态运行内核任务。

1.3、Linux I/O读写方式

轮询

基于死循环对 I/O 端口进行不断检测；
需要CPU参与。

I/O 中断

当数据到达时，磁盘主动向 CPU 发起中断请求，由 CPU 自身负责数据的传输过程；
需要CPU参与。

DMA 传输

DMA（Direct Memory Access，直接存储器访问）传输则在 I/O 中断的基础上引入了 DMA 磁盘控制器，由 DMA 磁盘控制器负责数据的传输，降低了 I/O 中断操作对 CPU 资源的大量消耗；
DMA本质上是一块主板上独立的芯片，允许外设设备和内存存储器之间直接进行IO数据传输，其过程不需要CPU的参与；
每个 I/O 设备里面都有自己的 DMA 控制器，如网卡、声卡、显卡、磁盘控制器等；
CPU 除了在数据传输开始和结束时做一点处理外（开始和结束时候要做中断处理），在传输过程中 CPU 可以继续进行其他的工作。这样在大部分时间里，CPU 计算和 I/O 操作都处于并行操作，使整个计算机系统的效率大大提高。

二、网络I/O

2.1、传统网络I/O

以网络传输文件为例，需要经历步骤如下图所示：

在这里插入图片描述

`read` + `write` 组合：

涉及上下文切换 4 次
- read 调用发起，图示（1）；
- read 调用返回，图示（4）；
- write 调用发起，图示（5）；
- write 调用返回，图示（8）；
数据拷贝 4 次
- 数据读取：
  - 磁盘拷贝到 page Cache，图示（2）DMA拷贝;
  - page Cache 拷贝到程序Buffer，图示（3）CPU拷贝;
- 数据写入：
  - 程序Buffer 拷贝到Socket缓存区，图示（6）CPU拷贝;
  - Socket缓存区拷贝到网卡，图示（7）DMA拷贝;
注意上图拷贝数据步骤（2）、（3）、（6）、（7）区别：（3）和（6）是CPU拷贝，（2）和（7）是DMA拷贝。

2.2、优化传统网络I/O

上文提到传统网络I/O性能最大的瓶颈在于：

数据拷贝次数过多；
上下文切换次数过多。

所以我们优化的主要方向就是这两个维度：减少数据拷贝次数和上下文切换次数。

2.2.1、减少数据拷贝次数

2.2.1.1、mmap（Memory Map，内存映射）

仔细观察，数据没有必要拷贝到程序 Buffer 中，我们可以采用 mmap（memory map，内存映射） 技术，将程序 Buffer 映射到内核 Page Cache，从而避免数据在内核态和用户态之间相互拷贝。

在这里插入图片描述

用`mmap` + `write` 组合替代`read` + `write` 组合后：

涉及上下文切换 4 次

mmap 调用和返回、 write 调用和返回。
数据拷贝 3 次
- 1次CPU拷贝;
- 2次DMA拷贝。

Java NIO有一个MappedByteBuffer的类，可以用来实现内存映射。它的底层是调用了Linux内核的mmap的API。

2.2.2、减少上下文切换次数

2.2.2.1、sendfile

目前为止，我们已经通过 mmap 技术成功的将数据拷贝次数减少了1次；但还是涉及4次上下文切换，我们可以将之前的两次系统调用（read、write）合并为一次，记为 sendfile（Linux 内核版本 2.1开始提供）， sendfile 不会拷贝数据到用户态，直接在内核态工作。

在这里插入图片描述