当前位置：首页 > article >正文

深入了解linux下TCP并发服务器和IO模型的实现

article 2024/11/13 22:08:57

一、整体框架

在网络编程中，服务器的架构可以根据需求不同而有所不同。主要有以下几种框架：

1. 单循环服务器：同一时刻只处理一个客户端的请求，通常使用传统的阻塞式编程模型。这种模型简单易实现，但处理能力有限，无法有效应对多个客户端的并发请求。

2. 并发服务器：能够处理多个客户端的请求。通过引入多线程或多进程等技术来实现并发处理，从而提高服务器的处理能力和响应速度。并发服务器可以分为以下几种实现方式：
- 多进程：每个客户端连接由一个独立的进程处理。常用于需要隔离处理环境的场景。
- 多线程：每个客户端连接由一个独立的线程处理。适用于需要较高资源共享的场景。
- IO多路复用：使用单个进程/线程处理多个连接，通过高效的IO多路复用机制来管理多个并发连接。适用于需要高并发处理的场景。

二、服务器

2.1 单循环服务器 vs 并发服务器

- 单循环服务器：
- 处理一个客户端的请求时，其他客户端的请求必须等待，导致处理效率低。
- 简单易实现，但不适合高并发场景。

- 并发服务器：
- 可以同时处理多个客户端的请求。通过创建多个进程或线程来处理不同的客户端连接，从而提高服务器的并发处理能力。
- UDP协议由于是无连接的，天然支持并发处理。每个数据报独立处理，不需要建立持久连接。
- TCP协议是面向连接的，传统上一个TCP服务器只能处理一个客户端连接。但通过多进程或多线程的方式，可以实现TCP并发服务器。

三、TCP并发服务器

3.1 多进程

多进程模型的服务器在接收到连接请求时，会创建一个新的进程来处理每一个客户端连接。以下是基本的执行流程：

1. socket()：创建一个新的套接字。
2. bind()：将套接字绑定到特定的IP地址和端口号。
3. listen()：将套接字设置为监听模式，等待客户端的连接请求。
4. accept()：接受客户端的连接请求，返回一个新的套接字用于与客户端通信。
5. fork()：创建一个子进程来处理新的客户端连接。父进程继续监听新的连接请求。

3.2 多线程

多线程模型的服务器在接收到连接请求时，会创建一个新的线程来处理每一个客户端连接。以下是一个示例代码：

/*************************************************************************
   > File Name: pthread.c
   > Author: yas
   > Mail: rage_yas@hotmail.com
   > Created Time: Tue 27 Aug 2024 02:48:41 PM
************************************************************************/

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <unistd.h>
#include <string.h>
#include <arpa/inet.h>

void *doSth(void *arg) {
int connfd = *((int *)arg);
while (1) {
char buff[1024] = {0};
ssize_t size = recv(connfd, buff, sizeof(buff), 0);
if (size <= 0) {
break;
}
printf("cli--------->%s\n", buff);
strcat(buff, "----->ok!");
send(connfd, buff, strlen(buff), 0);
}
close(connfd);
return NULL;
}

int conct(const char *ip, unsigned short port) {
int sockfd = socket(AF_INET, SOCK_STREAM, 0);
if (sockfd == -1) {
return -1;
}
struct sockaddr_in ser;
ser.sin_family = AF_INET;
ser.sin_port = htons(port);
ser.sin_addr.s_addr = inet_addr(ip);
int ret = bind(sockfd, (struct sockaddr *)&ser, sizeof(ser));
if (ret == -1) {
perror("fail bind");
return -1;
}
ret = listen(sockfd, 120);
if (ret == -1) {
return -1;
}
return sockfd;
}

int main(int argc, char *argv[]) {
int connfd = 0;
pthread_t tid;
int sockfd = conct("192.168.1.112", 60000);
if (sockfd == -1) {
return -1;
}
while (1) {
connfd = accept(sockfd, NULL, NULL);
if (connfd == -1) {
return -1;
}
pthread_create(&tid, NULL, doSth, &connfd);
pthread_detach(tid);
}
return 0;
}

在这个示例中：
- `pthread_create` 用于创建新的线程来处理客户端请求。
- `pthread_detach` 用于分离线程，使其在完成后自动回收资源。

3.3 IO多路复用

IO多路复用技术允许单个进程/线程处理多个IO操作，常用于高并发场景。主要实现方式有：
- select：检查多个文件描述符的状态，判断是否可以进行读写操作。
- poll：与`select`类似，但支持更多的文件描述符。
- epoll：高效的IO多路复用机制，适用于大规模文件描述符的场景。

四、IO模型

4.1 阻塞IO

在阻塞IO模型中，系统调用会阻塞直到有数据可用或操作完成。例如，`fgets`、`scanf`、`read`、`recv`等。

特点：
- CPU占有率低：由于阻塞等待，CPU不会频繁进行上下文切换。
- 执行效率低：处理效率低下，特别是在处理大量连接时。

4.2 非阻塞IO

非阻塞IO模型允许系统调用立即返回，无论是否有数据可用。需要通过轮询来检查数据的到达。

特点：
- CPU占有率高：由于轮询机制，CPU会不断检查IO状态，导致较高的占用率。
- 实现复杂：需要处理数据是否可用的逻辑。

实现步骤：
1. 获取文件描述符的属性。
2. 增加非阻塞属性。
3. 设置新属性。

示例代码：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <string.h>
#include <signal.h>

void handle(int signo) {
char buf[1024] = {0};
fgets(buf, sizeof(buf), stdin);
printf("STDIN : %s\n", buf);
}

int main(int argc, char *argv[]) {
signal(SIGIO, handle);
char buf[1024] = {0};
mkfifo("./fifo", 0666);
int fd = open("./fifo", O_RDONLY);
int flag = fcntl(0, F_GETFL);
flag = flag | O_ASYNC;
fcntl(0, F_SETFL, flag);
fcntl(0, F_SETOWN, getpid());
while (1) {
memset(buf, 0, sizeof(buf));
read(fd, buf, sizeof(buf));
sleep(1);
printf("%s\n", buf);
}
close(fd);
return 0;
}