当前位置：首页 > article >正文

Nginx（性能优化）

article 2025/2/21 3:40:45

到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等。

优化一：打开长连接配置

通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启HTTP长连接，用户减少握手的次数，降低服务器损耗，具体如下：

upstream xxx {  
    # 长连接数  
    keepalive 32;  
    # 每个长连接提供的最大请求数  
    keepalived_requests 100;  
    # 每个长连接没有新的请求时，保持的最长时间  
    keepalive_timeout 60s;  
}

优化二、开启零拷贝技术

零拷贝这个概念，在大多数性能较为不错的中间件中都有出现，例如Kafka、Netty等，而Nginx中也可以配置数据零拷贝技术，如下：

sendfile on; # 开启零拷贝机制

零拷贝读取机制与传统资源读取机制的区别：

「传统方式：」 硬件-->内核-->用户空间-->程序空间-->程序内核空间-->网络套接字
「零拷贝方式：」 硬件-->内核-->程序内核空间-->网络套接字

从上述这个过程对比，很轻易就能看出两者之间的性能区别。

优化三、开启无延迟或多包共发机制

在Nginx中有两个较为关键的性能参数，即tcp_nodelay、tcp_nopush，开启方式如下：

tcp_nodelay on;  
tcp_nopush on;

TCP/IP协议中默认是采用了Nagle算法的，即在网络数据传输过程中，每个数据报文并不会立马发送出去，而是会等待一段时间，将后面的几个数据包一起组合成一个数据报文发送，但这个算法虽然提高了网络吞吐量，但是实时性却降低了。❝因此你的项目属于交互性很强的应用，那么可以手动开启tcp_nodelay配置，让应用程序向内核递交的每个数据包都会立即发送出去。但这样会产生大量的TCP报文头，增加很大的网络开销。❞相反，有些项目的业务对数据的实时性要求并不高，追求的则是更高的吞吐，那么则可以开启tcp_nopush配置项，这个配置就类似于“塞子”的意思，首先将连接塞住，使得数据先不发出去，等到拔去塞子后再发出去。设置该选项后，内核会尽量把小数据包拼接成一个大的数据包（一个MTU）再发送出去.❝当然若一定时间后（一般为200ms），内核仍然没有积累到一个MTU的量时，也必须发送现有的数据，否则会一直阻塞。❞tcp_nodelay、tcp_nopush两个参数是“互斥”的，如果追求响应速度的应用推荐开启tcp_nodelay参数，如IM、金融等类型的项目。如果追求吞吐量的应用则建议开启tcp_nopush参数，如调度系统、报表系统等。❝注意：①tcp_nodelay一般要建立在开启了长连接模式的情况下使用。②tcp_nopush参数是必须要开启sendfile参数才可使用的。❞

优化四、调整Worker工作进程

Nginx启动后默认只会开启一个Worker工作进程处理客户端请求，而我们可以根据机器的CPU核数开启对应数量的工作进程，以此来提升整体的并发量支持，如下：

# 自动根据CPU核心数调整Worker进程数量  
worker_processes auto;

❝工作进程的数量最高开到8个就OK了，8个之后就不会有再大的性能提升。❞同时也可以稍微调整一下每个工作进程能够打开的文件句柄数：

# 每个Worker能打开的文件描述符，最少调整至1W以上，负荷较高建议2-3W  
worker_rlimit_nofile 20000;

❝操作系统内核（kernel）都是利用文件描述符来访问文件，无论是打开、新建、读取、写入文件时，都需要使用文件描述符来指定待操作的文件，因此该值越大，代表一个进程能够操作的文件越多（但不能超出内核限制，最多建议3.8W左右为上限）。❞

优化五、开启CPU亲和机制

对于并发编程较为熟悉的伙伴都知道，因为进程/线程数往往都会远超出系统CPU的核心数，因为操作系统执行的原理本质上是采用时间片切换机制，也就是一个CPU核心会在多个进程之间不断频繁切换，造成很大的性能损耗。而CPU亲和机制则是指将每个Nginx的工作进程，绑定在固定的CPU核心上，从而减小CPU切换带来的时间开销和资源损耗，开启方式如下：

worker_cpu_affinity auto;

优化六、开启epoll模型及调整并发连接数

在最开始就提到过：Nginx、Redis都是基于多路复用模型去实现的程序，但最初版的多路复用模型select/poll最大只能监听1024个连接，而epoll则属于select/poll接口的增强版，因此采用该模型能够大程度上提升单个Worker的性能，如下：

events {  
    # 使用epoll网络模型  
    use epoll;  
    # 调整每个Worker能够处理的连接数上限  
    worker_connections  10240;  
}

❝这里对于select/poll/epoll模型就不展开细说了，后面的IO模型文章中会详细剖析。❞

查看全文

http://www.kler.cn/a/160542.html

uniapp得app云打包问题

Mysql大数据量删除

SQL基础理论篇（十）：事务处理

STM32单片机项目实例：基于TouchGFX的智能手表设计（3）嵌入式程序任务调度的设计

持续集成交付CICD：Sonarqube自动更新项目质量配置

前端编码中快速填充内容--乱数假文

MySQL高可用

mvn site 命令

机器学习笔记 - 使用深度学习提高传统机器学习性能

nodejs+vue+微信小程序＋python＋PHP的Sd球鞋销售平台的设计与实现-计算机毕业设计推荐

JVM 执行引擎篇

pgsql 判空并设置默认值

【MySQL数据类型】

计网实验7

案例059:基于微信小程序的在线投稿系统

《电磁场与电磁波》（谢处方第5版）anki卡片学习笔记txt文件输出

C#，数值计算，计算实非对称矩阵的所有特征值和特征向量，简化为Hes-senberg形式，然后进行QR迭代

网络视频服务器的作用是什么？

Mac卸载、安装Python

图像处理领域的应用