【杂谈】服务端能同时处理多少个 Socket 连接?背后的资源与限制分析
一个服务端进程能同时连接多少个 Socket?
要理解一个服务端进程能同时支持多少个连接,首先我们需要明确一个 socket 连接 的表示方式。一个连接由四个部分组成:[LocalIP:LocalPort:RemoteIP:RemotePort]。对于服务端进程来说,LocalIP 和 LocalPort 是固定的,而 RemoteIP 和 RemotePort 则是可以变化的。思考一下,RemoteIP 可以有多少种可能?RemotePort 又可以有多少种可能?这两者组合起来,理论上能够支持多少个连接呢?
从理论上讲,组合的可能性为:
-
(RemoteIP) 2^32 * (RemotePort) 2^16 = 2^48
这意味着,理论上一个服务端进程可以支持 2^48 个连接。然而,实际中,连接数通常会受到其他系统资源的限制。
是否受端口数限制?
首先需要明确的是,服务端监听一个端口时仅占用一个端口。与客户端建立连接并不会占用服务端的端口。端口数量限制的是客户端,每个客户端在建立连接时才会占用一个本地端口。
服务端的连接数不受端口数量的影响。
不受端口限制,那它受什么限制呢?
服务端支持的连接数主要受文件描述符的限制。每个 socket 连接都需要占用一个文件描述符,Linux 系统,一个用户进程默认的文件描述符数量通常是 1024。如果连接数超过这个值,应用程序就会报错,提示“文件描述符不足”。
幸运的是,文件描述符的数量是可以调整的,根据需求,可以将其设置为 10 万个或更多,完全可以满足大多数应用的需求。
下面改到100w
// /etc/security/limits.conf
* soft nofile 1000000
* hard nofile 1000000
// /etc/sysctl.conf
fs.file-max = 1000000
文件描述符是什么?它占用什么资源?
文件描述符是操作系统用来标识打开的文件或 socket 连接的一个“标识符”。本身并不占用太多资源,它只是操作系统内部的一种管理方式。
那么,socket 占用服务器的哪些资源呢?
1)内存
每个 socket 连接在内核空间会分配接收和发送缓冲区。假设每个缓冲区默认大小为 128KB,如果服务端要管理 10 万个连接,那么所需的内存就是:
-
10 万 * 256KB = 24.41GB 内存
如果服务器内存不足 24GB,但仍需要支持 10 万个连接,可以通过调整系统的缓冲区配置来减少每个连接所需的内存。
例如,可以修改以下内核参数来调整 TCP 缓冲区的大小:
# 默认配置
# 内核会根据实际的网络情况自动调整缓冲区的大小,在最小值和最大值间浮动
net.ipv4.tcp_rmem = 4096 131072 6291456
-
4096:最小值
-
131072:默认值
-
6291456:最大值
可以将其都改成4096,也就是4KB。这样10万个连接,只占用781.25MB
2)线程
服务端进程需要使用线程来处理接收和发送的数据。现代的服务端大多使用 NIO(非阻塞 I/O)模型,在该模型中,一个 worker 线程可以管理多个 socket 连接。通过 select
或 epoll
等机制,NIO 模型可以高效地选择需要处理的 socket 连接。
通常,worker 线程的数量是固定的,并不需要太多,20 个左右就足够。这些 worker 线程负责处理接收到的数据包,然后将完整的数据包交给应用层的线程池,后者负责执行实际的业务逻辑。
连接数 ≠ 并发量:一个服务端进程能应付多少个 socket 通信?
实际应用中,连接数并不等于并发量。并发量指的是同一时刻正在进行数据交换的连接数,而连接数指的是总的连接数。
一个服务端进程可以管理大量的 socket 连接,但如果每个连接的通信频率较低(例如,物联网设备的定时数据上报、偶尔发送指令等),那么即使连接数很高,系统也可以轻松应对。
例如,在一个物联网平台中,设备定期上报数据,偶尔发送异常报告或接收指令,这种应用场景下,服务端能管理的连接数和通信量通常没有太大压力。
然而,如果应用的客户端和服务端之间频繁通信且实时性要求较高(例如,实时数据传输、低延迟处理等),则需要考虑更多因素。此时,NIO 模型是否会导致延迟?单个服务节点是否能够支持如此频繁的连接?是否需要分散负载,使用多个服务节点来提高并发能力?
题外话:为什么NIO会有延迟?
NIO的设计特点是一个Worker线程负责管理多个Socket连接的通信。假设一个Worker线程同时处理10个Socket连接,当这10个Socket同时收到数据包时,处理顺序就会依赖于它们的到达顺序。在这种情况下,最后一个接收到数据包的Socket必须等待前面9个数据包的解析和分发,因此会有一定的延迟。
然而,在大多数实际业务场景中,多个Socket同时接收数据的情况并不常见。而且,即使存在延迟,它通常也不会对业务产生显著影响,延迟水平通常在可接受的范围内。
总结
一个服务端进程能同时连接的 socket 数量不仅取决于端口数,而是受文件描述符、内存、线程等资源的限制。通过调整系统配置和优化架构,服务端可以高效地管理大量连接。但在高频繁通信的场景下,可能需要进一步考虑架构优化,例如使用 NIO 处理延迟,或通过分布式架构分散负载,确保系统能够承载高并发的连接。
文章转载自:猫毛·波拿巴
原文链接:https://www.cnblogs.com/longfurcat/p/18615422
体验地址:引迈 - JNPF快速开发平台_低代码开发平台_零代码开发平台_流程设计器_表单引擎_工作流引擎_软件架构