Linux 中的poll、select和epoll有什么区别?
poll
和 select
是Linux 系统中用于多路复用 I/O 的系统调用,它们允许一个程序同时监视多个文件描述符,以便在任何一个文件描述符准备好进行 I/O 操作时得到通知。
一、select
select
是一种较早的 I/O 多路复用机制,具有以下特点:
-
接口:
-
select
使用三个文件描述符集合(读、写、异常)来监视文件描述符的状态。 -
函数签名为:
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
-
nfds
是需要监视的文件描述符的数量(通常是最大文件描述符加一)。 -
fd_set
是一个位图结构,用于表示文件描述符集合。 -
timeout
指定等待事件发生的超时时间。
-
-
限制:
select
的文件描述符数量受到 FD_SETSIZE 的限制,通常为 1024。这意味着它不适合处理非常大量的并发连接。
-
效率:
- 每次调用
select
都需要重新初始化文件描述符集合,因此在处理大量文件描述符时效率较低。
- 每次调用
-
可移植性:
select
是 POSIX 标准的一部分,因此在许多操作系统上都可用。
select
示例:同时监视多个文件描述符的 I/O 事件
这个例子展示了如何使用 select
来监视两个文件描述符:标准输入(通常是终端输入)和一个网络套接字。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/select.h>
#include <sys/socket.h>
#include <netinet/in.h>
#define PORT 8080
#define BUFFER_SIZE 1024
int main() {
int sockfd, newsockfd;
struct sockaddr_in servaddr, cliaddr;
socklen_t clilen;
char buffer[BUFFER_SIZE];
fd_set readfds;
int maxfd;
// 创建套接字
sockfd = socket(AF_INET, SOCK_STREAM, 0);
if (sockfd < 0) {
perror("socket creation failed");
exit(EXIT_FAILURE);
}
// 初始化服务器地址结构
memset(&servaddr, 0, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = INADDR_ANY;
servaddr.sin_port = htons(PORT);
// 绑定套接字
if (bind(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr)) < 0) {
perror("bind failed");
close(sockfd);
exit(EXIT_FAILURE);
}
// 监听
if (listen(sockfd, 5) < 0) {
perror("listen failed");
close(sockfd);
exit(EXIT_FAILURE);
}
// 接受一个连接
clilen = sizeof(cliaddr);
newsockfd = accept(sockfd, (struct sockaddr *)&cliaddr, &clilen);
if (newsockfd < 0) {
perror("accept failed");
close(sockfd);
exit(EXIT_FAILURE);
}
while (1) {
// 清空文件描述符集合
FD_ZERO(&readfds);
// 将标准输入和新套接字添加到集合中
FD_SET(STDIN_FILENO, &readfds);
FD_SET(newsockfd, &readfds);
maxfd = (STDIN_FILENO > newsockfd) ? STDIN_FILENO : newsockfd;
// 使用 select 监视
if (select(maxfd + 1, &readfds, NULL, NULL, NULL) < 0) {
perror("select error");
break;
}
// 检查标准输入是否有数据
if (FD_ISSET(STDIN_FILENO, &readfds)) {
if (fgets(buffer, BUFFER_SIZE, stdin) != NULL) {
printf("Input from stdin: %s", buffer);
}
}
// 检查套接字是否有数据
if (FD_ISSET(newsockfd, &readfds)) {
int n = read(newsockfd, buffer, BUFFER_SIZE);
if (n <= 0) {
printf("Client disconnected\n");
break;
}
buffer[n] = '\0';
printf("Received from client: %s", buffer);
}
}
close(newsockfd);
close(sockfd);
return 0;
}
二、poll
poll
是 select
的改进版本,提供了一些更灵活的特性:
-
接口:
-
poll
使用一个结构体数组来监视文件描述符的状态。 -
函数签名为:
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
-
pollfd
结构体包含文件描述符及其感兴趣的事件。 -
timeout
以毫秒为单位,指定等待事件发生的超时时间。
-
-
无数量限制:
poll
不受 FD_SETSIZE 限制,因此可以监视的文件描述符数量仅受系统资源的限制。
-
效率:
- 由于
poll
使用数组而不是位图,每次调用不需要重新初始化整个集合,但仍然需要扫描整个数组,因此在处理非常大量文件描述符时效率也受到限制。
- 由于
-
事件类型:
poll
可以监视更多类型的事件,如挂起和优先级数据。
poll
示例:监视标准输入和一个网络套接字
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <poll.h>
#include <sys/socket.h>
#include <netinet/in.h>
#define PORT 8080
#define BUFFER_SIZE 1024
int main() {
int sockfd, newsockfd;
struct sockaddr_in servaddr, cliaddr;
socklen_t clilen;
char buffer[BUFFER_SIZE];
struct pollfd fds[2];
// 创建套接字
sockfd = socket(AF_INET, SOCK_STREAM, 0);
if (sockfd < 0) {
perror("socket creation failed");
exit(EXIT_FAILURE);
}
// 初始化服务器地址结构
memset(&servaddr, 0, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = INADDR_ANY;
servaddr.sin_port = htons(PORT);
// 绑定套接字
if (bind(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr)) < 0) {
perror("bind failed");
close(sockfd);
exit(EXIT_FAILURE);
}
// 监听
if (listen(sockfd, 5) < 0) {
perror("listen failed");
close(sockfd);
exit(EXIT_FAILURE);
}
// 接受一个连接
clilen = sizeof(cliaddr);
newsockfd = accept(sockfd, (struct sockaddr *)&cliaddr, &clilen);
if (newsockfd < 0) {
perror("accept failed");
close(sockfd);
exit(EXIT_FAILURE);
}
// 设置 poll 文件描述符
fds[0].fd = STDIN_FILENO;
fds[0].events = POLLIN;
fds[1].fd = newsockfd;
fds[1].events = POLLIN;
while (1) {
// 使用 poll 监视
int ret = poll(fds, 2, -1);
if (ret < 0) {
perror("poll error");
break;
}
// 检查标准输入是否有数据
if (fds[0].revents & POLLIN) {
if (fgets(buffer, BUFFER_SIZE, stdin) != NULL) {
printf("Input from stdin: %s", buffer);
}
}
// 检查套接字是否有数据
if (fds[1].revents & POLLIN) {
int n = read(newsockfd, buffer, BUFFER_SIZE);
if (n <= 0) {
printf("Client disconnected\n");
break;
}
buffer[n] = '\0';
printf("Received from client: %s", buffer);
}
}
close(newsockfd);
close(sockfd);
return 0;
}
三、epoll
epoll
是 Linux 内核提供的一种高效的 I/O 事件通知机制,用于处理大量文件描述符的事件。它是 poll
和 select
系统调用的改进版本,专为解决在处理大量并发连接时的性能问题而设计
epoll
的主要特点包括:
- 高效性:与
select
和poll
不同,epoll
不需要在每次调用时重新传递所有的文件描述符集。它通过一个文件描述符来管理感兴趣的事件,减少了内核和用户空间之间的数据拷贝。 - 水平触发和边缘触发:
epoll
支持两种触发模式。水平触发(Level-Triggered)模式类似于select
和poll
的工作方式,而边缘触发(Edge-Triggered)模式则更加高效,但也更复杂,需要更仔细的事件处理。 - 支持大规模连接:
epoll
能够更好地处理大规模并发连接,因此非常适合用在高性能服务器应用中,如网络服务器或代理服务器。 - 事件注册和监听分离:通过
epoll_ctl
可以动态地添加、修改或删除监听的文件描述符,而epoll_wait
用于等待事件的发生。
使用 epoll
通常涉及三个主要的系统调用:
epoll_create
:创建一个epoll
实例。epoll_ctl
:注册、修改或删除感兴趣的事件。epoll_wait
:等待事件的发生并获取事件列表。
epoll
是 Linux 特有的 I/O 多路复用机制,专为处理大量并发连接而设计。与 select
和 poll
相比,epoll
更高效,因为它在内核中维护一个事件表,避免了每次调用都需要重新传递完整的文件描述符集合。
应用示例:监视标准输入和一个网络套接字。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <sys/epoll.h>
#include <sys/socket.h>
#include <netinet/in.h>
#define PORT 8080
#define BUFFER_SIZE 1024
#define MAX_EVENTS 10
int main() {
int sockfd, newsockfd, epollfd;
struct sockaddr_in servaddr, cliaddr;
socklen_t clilen;
char buffer[BUFFER_SIZE];
struct epoll_event ev, events[MAX_EVENTS];
int nfds;
// 创建套接字
sockfd = socket(AF_INET, SOCK_STREAM, 0);
if (sockfd < 0) {
perror("socket creation failed");
exit(EXIT_FAILURE);
}
// 初始化服务器地址结构
memset(&servaddr, 0, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = INADDR_ANY;
servaddr.sin_port = htons(PORT);
// 绑定套接字
if (bind(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr)) < 0) {
perror("bind failed");
close(sockfd);
exit(EXIT_FAILURE);
}
// 监听
if (listen(sockfd, 5) < 0) {
perror("listen failed");
close(sockfd);
exit(EXIT_FAILURE);
}
// 创建 epoll 实例
epollfd = epoll_create1(0);
if (epollfd == -1) {
perror("epoll_create1 failed");
close(sockfd);
exit(EXIT_FAILURE);
}
// 将监听套接字添加到 epoll 实例中
ev.events = EPOLLIN;
ev.data.fd = sockfd;
if (epoll_ctl(epollfd, EPOLL_CTL_ADD, sockfd, &ev) == -1) {
perror("epoll_ctl: sockfd");
close(sockfd);
close(epollfd);
exit(EXIT_FAILURE);
}
// 将标准输入添加到 epoll 实例中
ev.events = EPOLLIN;
ev.data.fd = STDIN_FILENO;
if (epoll_ctl(epollfd, EPOLL_CTL_ADD, STDIN_FILENO, &ev) == -1) {
perror("epoll_ctl: stdin");
close(sockfd);
close(epollfd);
exit(EXIT_FAILURE);
}
while (1) {
// 等待事件发生
nfds = epoll_wait(epollfd, events, MAX_EVENTS, -1);
if (nfds == -1) {
perror("epoll_wait failed");
break;
}
for (int n = 0; n < nfds; ++n) {
if (events[n].data.fd == sockfd) {
// 处理新连接
clilen = sizeof(cliaddr);
newsockfd = accept(sockfd, (struct sockaddr *)&cliaddr, &clilen);
if (newsockfd == -1) {
perror("accept failed");
continue;
}
// 将新连接添加到 epoll 实例中
ev.events = EPOLLIN;
ev.data.fd = newsockfd;
if (epoll_ctl(epollfd, EPOLL_CTL_ADD, newsockfd, &ev) == -1) {
perror("epoll_ctl: newsockfd");
close(newsockfd);
continue;
}
} else if (events[n].data.fd == STDIN_FILENO) {
// 处理标准输入
if (fgets(buffer, BUFFER_SIZE, stdin) != NULL) {
printf("Input from stdin: %s", buffer);
}
} else {
// 处理来自客户端的数据
int n = read(events[n].data.fd, buffer, BUFFER_SIZE);
if (n <= 0) {
if (n == 0) {
printf("Client disconnected\n");
} else {
perror("read error");
}
close(events[n].data.fd);
} else {
buffer[n] = '\0';
printf("Received from client: %s", buffer);
}
}
}
}
close(sockfd);
close(epollfd);
return 0;
}
解释
- 创建套接字:首先创建一个 TCP 套接字并绑定到指定端口,然后开始监听连接。
- 创建
epoll
实例:使用epoll_create1
创建一个新的epoll
实例。 - 注册文件描述符:将监听套接字和标准输入文件描述符注册到
epoll
实例中,以便监视它们的可读事件。 - 事件循环:使用
epoll_wait
等待事件发生。当有事件发生时,检查是哪种事件并进行相应处理:- 如果是监听套接字有事件,表示有新连接到达,使用
accept
接受连接并将新套接字注册到epoll
实例中。 - 如果是标准输入有事件,读取输入并处理。
- 如果是客户端套接字有事件,读取数据并处理。
- 如果是监听套接字有事件,表示有新连接到达,使用
- 清理:在程序结束时关闭所有打开的文件描述符。
四、总结
poll和select机制
- 用户空间到内核空间的拷贝:每次调用
select
或poll
时,用户必须将所有需要监视的文件描述符列表传递给内核。这意味着每次调用都需要将这些数据从用户空间复制到内核空间,这在监视大量文件描述符时效率较低。 - 线性扫描:内核需要扫描所有文件描述符以确定哪些文件描述符有事件发生。这种线性扫描在文件描述符数量很大时效率不高。
epoll机制
- 内核维护事件表:
epoll
通过epoll_create
创建一个epoll
实例,这个实例在内核中维护一个事件表。这个表记录了所有已经注册的文件描述符及其感兴趣的事件类型。 - 增量更新:通过
epoll_ctl
,用户可以增量地添加、修改或删除文件描述符及其感兴趣的事件。这意味着用户只需要在文件描述符集合发生变化时进行更新,而不是每次等待事件时都传递整个集合。 - 事件驱动:
epoll_wait
返回的不是所有文件描述符的状态,而是已经准备好进行 I/O 操作的文件描述符列表。这使得epoll
在处理大量文件描述符时更加高效,因为它只返回有事件的文件描述符。
在 select
/poll
中,每次都需要将完整的文件描述符集合传递给内核,而 epoll
通过维护一个事件表,只在有事件发生时通知用户空间,从而提高了效率