当前位置: 首页 > article >正文

[Linux]IO多路转接(上)

1. IO 多路转接之select

1.1 select概述

select 是系统提供的一个多路转接接口,其核心工作在于等待。它能够让程序同时监视多个文件描述符上的事件是否就绪,只有当被监视的多个文件描述符中有一个或多个事件就绪时,select 才会成功返回,并将对应文件描述符的就绪事件告知调用者。

1.2 select函数

  1. 函数原型:int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
  2. 参数说明:
    • nfds:需要监视的文件描述符中,最大的文件描述符值 + 1。
    • readfds:输入输出型参数。调用时用户告知内核需监视哪些文件描述符的读事件是否就绪,返回时内核告知用户哪些文件描述符的读事件已就绪。
    • writefds:输入输出型参数。调用时告知内核需监视哪些文件描述符的写事件是否就绪,返回时告知哪些文件描述符的写事件已就绪。
    • exceptfds:输入输出型参数。调用时告知内核需监视哪些文件描述符的异常事件是否就绪,返回时告知哪些文件描述符的异常事件已就绪。
    • timeout:输入输出型参数。调用时由用户设置 select 的等待时间,返回时表示 timeout 的剩余时间。其取值有以下几种情况:
      • NULL/nullptrselect 调用后进行阻塞等待,直至被监视的某个文件描述符上的某个事件就绪。
      • 0select 调用后进行非阻塞等待,无论被监视的文件描述符上的事件是否就绪,select 检测后都会立即返回。
      • 特定的时间值:select 调用后在指定时间内进行阻塞等待,若被监视的文件描述符上一直无事件就绪,则在该时间后 select 进行超时返回。
  • 返回值说明:
    • 若函数调用成功,则返回有事件就绪的文件描述符个数。
    • timeout 时间耗尽,则返回0。
    • 若函数调用失败,则返回 -1,同时错误码会被设置,可能的错误码有:
      • EBADF:文件描述符为无效的或该文件已关闭。
      • EINTR:此调用被信号所中断。
      • EINVAL:参数 nfds 为负值。
      • ENOMEM:核心内存不足。

1.3 fd_set结构

fd_set 结构与 sigset_t 结构类似,本质是一个位图,通过位图中对应的位来表示要监视的文件描述符。在调用 select 函数之前,需用 fd_set 结构定义出对应的文件描述符集,然后将需监视的文件描述符添加到该集合中。

/* fd_set for select and pselect. */
typedef struct
{
    /* XPG4.2 requires this member name. Otherwise avoid the name
       from the global namespace. */
    #ifdef _USE_XOPEN
        __fd_mask fds_bits[__FD_SETSIZE / __NDBITS];
        #define _FDS_BITS(set) ((set)->fds_bits)
    #else
        __fd_mask _fds_bits[__FD_SETSIZE / __NDBITS];
        #define _FDS_BITS(set) ((set)->_fds_bits)
    #endif
} fd_set;
typedef long int _fd_mask;

这个添加过程虽本质是位操作,但系统提供了一组专门接口来操作 fd_set 类型的位图,如下:

void FD_CLR (int fd, fd_set *set); // 用来清除描述词组 set 中相关 fd 的位
int FD_ISSET (int fd, fd_set *set); // 用来测试描述词组 set 中相关 fd 的位是否为真
void FD_SET (int fd, fd_set *set); // 用来设置描述词组 set 中相关 fd 的位
void FD_ZERO (fd_set *set); // 用来清除描述词组 set 的全部位

1.4 timeval结构

传入 select 函数的最后一个参数 timeout,是一个指向 timeval 结构的指针。timeval 结构用于描述一段时间长度,该结构包含两个成员,其中 tv_sec 表示秒,tv_usec 表示微秒。

struct timeval {
    __kernel_time_t tv_sec;  /* seconds */
    __kernel_suseconds_t tv_usec;  /* microseconds */
};

总的来说,select 机制为程序同时处理多个文件描述符的事件就绪情况提供了一种有效的方式,通过合理设置其参数及利用相关结构的操作接口,能较好地实现对多个文件描述符的监控与处理,不过在使用过程中也需要注意处理可能出现的各种返回情况及错误码。

1.5 socket 就绪条件

1.5.1 读事件就绪条件
  1. 接收缓冲区字节数足够
    • socket 内核中接收缓冲区的字节数大于等于低水位标记 SO_RCVLOWAT 时,可以无阻塞地读取该文件描述符,且读取返回值大于0。
  2. 对端关闭连接
    • socket TCP 通信中,如果对端关闭连接,那么对该 socket 进行读操作时,会返回0。
  3. 监听socket有新连接请求
    • 对于监听的socket,当有新的连接请求到来时,该socket处于读就绪状态。
    • 这是服务器端socket常见的就绪情况,用于接受新的客户端连接。
  4. socket有未处理错误
    • 当socket上存在未处理的错误时,它也处于读就绪状态。
    • 这种情况需要及时处理错误,以确保socket的正常运行。
1.5.2 写事件就绪条件
  1. 发送缓冲区有足够空间
    • socket 内核中发送缓冲区的可用字节数大于等于低水位标记 SO_SNDLOWAT 时,可以无阻塞地进行写操作,且写操作返回值大于0。
  2. 写操作被关闭
    • socket 的写操作被关闭(例如通过 closeshutdown 函数)后,对这个写操作被关闭的 socket 进行写操作,会触发 SIGPIPE 信号。
  3. 非阻塞 connect 操作完成(成功或失败)
    • socket 使用非阻塞 connect 连接操作完成(无论是连接成功还是失败)后,该 socket 处于写就绪状态。
  4. socket 有未读取错误
    • socket 上存在未读取的错误时,它处于写就绪状态。
1.5.3 异常事件就绪
  1. 收到带外数据
    • socket 收到带外数据时,处于异常就绪状态。带外数据与TCP的紧急模式相关,通过TCP报头中的 URG 标志位和16位紧急指针搭配使用来发送和接收带外数据。

2. 服务端代码

然后我们就可以编写一个基于 select多路转接的 TCP 服务端:

#pragma once
#include <iostream>
#include <string>
#include <unistd.h>
#include <cstring>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <netinet/in.h>

// 定义可能出现的错误码
enum
{
    SocketErr = 1,
    BindErr,
    ListenErr
};

// 定义最大连接数
const int backlog = 10;

class Sock
{
public:
    Sock() {}

public:
    // 创建套接字
    void Socket()
    {
        // 使用IPv4协议族,流式套接字(TCP)创建套接字
        _sockfd = socket(AF_INET, SOCK_STREAM, 0);
        if (_sockfd < 0)
        {
            // 如果创建套接字失败,输出错误信息并退出程序
            std::cerr << "socket error..." << std::endl;
            exit(SocketErr);
        }
        int opt = 1;
        // 设置套接字选项,允许地址重用
        setsockopt(_sockfd, SOL_SOCKET, SO_REUSEADDR | SO_REUSEPORT, &opt, sizeof(opt));
    }

    // 绑定套接字到指定端口
    void Bind(uint16_t port)
    {
        struct sockaddr_in local;
        // 初始化结构体
        memset(&local, 0, sizeof(local));
        local.sin_family = AF_INET;
        // 将端口转换为网络字节序
        local.sin_port = htons(port);
        // 绑定任意本地IP地址
        local.sin_addr.s_addr = INADDR_ANY;
        if (bind(_sockfd, (const struct sockaddr *)&local, sizeof(local)) < 0)
        {
            // 如果绑定失败,输出错误信息并退出程序
            std::cerr << "bind error..." << std::endl;
            exit(BindErr);
        }
    }

    // 监听套接字
    void Listen()
    {
        if (listen(_sockfd, backlog) < 0)
        {
            // 如果监听失败,输出错误信息并退出程序
            std::cerr << "listen error..." << std::endl;
            exit(ListenErr);
        }
    }

    // 接受客户端连接
    int Accept(std::string *clientip, uint16_t *clientport)
    {
        struct sockaddr_in peer;
        socklen_t len = sizeof(peer);
        // 接受客户端连接,返回新的套接字描述符
        int newfd = accept(_sockfd, (struct sockaddr *)&peer, &len);
        if (newfd < 0)
        {
            std::cout << "accept error..." << std::endl;
            return -1;
        }
        char ipstr[64];
        // 将网络字节序的IP地址转换为点分十进制字符串
        inet_ntop(AF_INET, &peer.sin_addr, ipstr, sizeof(ipstr));
        *clientip = ipstr;
        // 将网络字节序的端口转换为主机字节序
        *clientport = ntohs(peer.sin_port);
        return newfd;
    }

    // 连接到指定IP和端口
    bool Connect(const std::string &ip, const uint16_t &port)
    {
        struct sockaddr_in peer;
        memset(&peer, 0, sizeof(peer));
        peer.sin_family = AF_INET;
        peer.sin_port = htons(port);
        // 将点分十进制IP字符串转换为网络字节序
        inet_pton(AF_INET, ip.c_str(), &peer.sin_addr);
        int n = connect(_sockfd, (const struct sockaddr *)&peer, sizeof(peer));
        if (n == -1)
        {
            // 如果连接失败,输出错误信息并返回false
            std::cerr << "connect to " << ip << ":" << port << "error" << std::endl;
            return false;
        }
        return true;
    }

    // 关闭套接字
    void Close()
    {
        close(_sockfd);
    }

    // 获取套接字描述符
    int Fd()
    {
        return _sockfd;
    }

private:
    int _sockfd;
};
#pragma once
#include "Sock.hpp"
#include <sys/select.h>

// 定义默认文件描述符值
#define DFL_FD -1
// 定义文件描述符数组的大小
#define NUM 128

class SelectServer
{
public:
    // 构造函数,初始化服务器监听端口
    SelectServer(int port)
        : _port(port)
    {
    }

    // 初始化服务器相关设置,包括创建、绑定和监听套接字
    void InitSelectServer()
    {
        // 创建套接字
        _listensock.Socket();
        // 将套接字绑定到指定端口
        _listensock.Bind(_port);
        // 开始监听套接字
        _listensock.Listen();
    }

    // 运行服务器,处理客户端连接和数据读取等操作
    void Run()
    {
        fd_set readfds;
        int fd_array[NUM];

        // 初始化文件描述符数组,将所有元素设为默认值
        for (int i = 0; i < NUM; i++)
        {
            fd_array[i] = DFL_FD;
        }

        // 将监听套接字的文件描述符放入数组的第一个位置
        fd_array[0] = _listensock.Fd();

        while (true)
        {
            // 清空读文件描述符集合
            FD_ZERO(&readfds);
            int maxfd = DFL_FD;

            // 遍历文件描述符数组,将有效的文件描述符添加到读文件描述符集合中,并更新最大文件描述符值
            for (int i = 0; i < NUM; i++)
            {
                if (fd_array[i] == DFL_FD)
                    continue;
                FD_SET(fd_array[i], &readfds);
                if (fd_array[i] > maxfd)
                {
                    maxfd = fd_array[i];
                }
            }

            // 调用select函数等待事件发生
            // struct timeval timeout = {2, 0};
            switch (select(maxfd + 1, &readfds, nullptr, nullptr, nullptr))
            {
            case 0:
                // 如果select返回0,表示超时
                // std::cout << "time out..." << std::endl;
                break;
            case -1:
                // 如果select返回 -1,表示发生错误,输出错误信息
                std::cerr << "select error" << std::endl;
                break;
            default:
                // 如果select正常返回,调用HandlerEvent处理就绪事件
                HandlerEvent(readfds, fd_array, NUM);
                break;
            }
        }
    }

    // 析构函数,关闭监听套接字
    ~SelectServer()
    {
        if (_listensock.Fd() >= 0)
        {
            _listensock.Close();
        }
    }

private:
    // 处理就绪事件的函数
    void HandlerEvent(const fd_set &readfds, int fd_array[], int num)
    {
        for (int i = 0; i < num; i++)
        {
            if (fd_array[i] == DFL_FD)
                continue;

            // 如果是监听套接字且有可读事件,表示有新的客户端连接
            if (fd_array[i] == _listensock.Fd() && FD_ISSET(fd_array[i], &readfds))
            {
                struct sockaddr_in peer;
                socklen_t len = sizeof(peer);
                memset(&peer, 0, len);
                std::string clientip;
                uint16_t clientport;

                // 接受新的客户端连接,获取客户端的套接字描述符、IP地址和端口号
                int sock = _listensock.Accept(&clientip, &clientport);
                std::cout << "get a new link[" << clientip << ":" << clientport << "]" << std::endl;

                // 将新连接的套接字描述符放入文件描述符数组中,如果数组已满则关闭该套接字并输出提示信息
                if (!SetFdArray(fd_array, num, sock))
                {
                    close(sock);
                    std::cout << "select server is full,close fd:" << sock << std::endl;
                }
            }

            // 如果不是监听套接字且有可读事件,表示有数据可读,进行数据读取和处理
            else if (FD_ISSET(fd_array[i], &readfds))
            {
                char buffer[1024];
                ssize_t n = read(fd_array[i], buffer, sizeof(buffer) - 1);

                if (n > 0)
                {
                    // 如果读取到数据,添加字符串结束符并输出数据内容
                    buffer[n] = 0;
                    std::cout << "echo# " << buffer << std::endl;
                }
                else if (n == 0)
                {
                    // 如果读取到的字节数为0,表示客户端已断开连接,关闭对应的套接字并将数组元素设为默认值
                    std::cout << "client quit..." << std::endl;
                    close(fd_array[i]);
                    fd_array[i] = DFL_FD;
                }
                else
                {
                    // 如果读取发生错误,输出错误信息,关闭对应的套接字并将数组元素设为默认值
                    std::cerr << "read error" << std::endl;
                    close(fd_array[i]);
                    fd_array[i] = DFL_FD;
                }
            }
        }
    }

    // 将新的套接字描述符放入文件描述符数组中的函数
    bool SetFdArray(int fd_array[], int num, int fd)
    {
        for (int i = 0; i < num; i++)
        {
            if (fd_array[i] == DFL_FD)
            {
                fd_array[i] = fd;
                return true;
            }
        }
        return false;
    }

private:
    Sock _listensock;
    int _port;
};

服务器当前调用select函数时将timeout参数设置为nullptr,这使得select函数调用后会进入阻塞等待状态。

起初,服务器第一次调用select函数时,仅让其监视监听套接字的读事件。如此一来,在服务器运行后,若没有客户端发送连接请求,监听套接字的读事件就不会变为就绪状态,那么服务器就会一直在这第一次调用的select函数中持续阻塞等待下去。

当我们利用telnet工具向该select服务器发起连接请求时,情况就会发生变化。此时,select函数能够立刻检测到监听套接字的读事件已经就绪,进而select函数会成功返回。并且,执行相应的事件处理。

3. select 的缺陷

虽然 select可以实现多路转接,提升 IO 效率。但是我们在实际应用中,很少会用到 select,因为:

  • 每次调用 select 时,都需要手动设置fd集合,从接口使用的便捷性角度来看,这种操作方式较为繁琐,给开发者带来了不便。
  • 每次调用 select,都要把 fd 集合从用户态拷贝到内核态。当需要监控的文件描述符数量很多时,这种数据拷贝操作所产生的开销会变得很大,影响系统性能。
  • 每次调用 select,内核都需要遍历传递进来的所有 fd。同样,在 fd 数量众多的情况下,这个遍历过程所消耗的系统资源也会很大,进一步降低系统的运行效率。

并且 select 可监控的文件描述描述符数量取决于 fd_set 类型的比特位个数。一般情况下 select 可监控的文件描述符个数通常为1024个。这在实际应用中是一个较大的局限,例如在实现 select 服务器时,除去一个监听套接字,最多只能连接1023个客户端,对于一些需要处理大量并发连接的场景,这个数量可能远远不够。


http://www.kler.cn/a/391009.html

相关文章:

  • 网络安全-蓝队基础
  • SOLIDWORKS代理商鑫辰信息科技
  • 解决:WSL2可视化opencv和pyqt冲突:QObject::moveToThread
  • Day09 C++ 存储类
  • Python如何用正则表达式匹配并处理文件名
  • 第二天python笔记
  • 微波无源器件 OMT1 一种用于倍频程接收机前端的十字转门四脊正交模耦合器(24-51GHz)
  • Java-03
  • SQL50题
  • ubuntu 20.04 NVIDIA驱动、cuda、cuDNN安装
  • Python 类私化有笔记
  • 【深度学习遥感分割|论文解读2】UNetFormer:一种类UNet的Transformer,用于高效的遥感城市场景图像语义分割
  • 量化交易系统开发-实时行情自动化交易-3.4.2.2.Okex交易数据
  • 从0开始搭建一个生产级SpringBoot2.0.X项目(十三)SpringBoot连接MongoDB
  • 请求接口时跨域问题详细解决方案
  • 前端开发调试之 PC 端调试
  • 使用 `RestTemplate` 获取二进制数据并返回 `byte[]`:解决方案与示例
  • Java 多态 (Polymorphism)详解
  • 智能社区服务小程序+ssm
  • MySQL数据库:SQL语言入门 (学习笔记)
  • ubuntu 20.04添加ros官方的软件源(解决下载ros软件包出现的E 无法定位软件包的问题)
  • ERP学习笔记-预处理eeglab
  • Transformer模型中的位置编码介绍
  • 群晖 Docker 容器文件夹出现未知用户 UID 1000
  • 开源TTS语音克隆神器GPT-SoVITS_V2版本地整合包部署与远程使用生成音频
  • 云计算在教育领域的应用