【高性能】什么是QPS、RT?
目录
一、RT
二、QPS
QPS指的是系统每秒能处理的请求数量(Query Per Second),在Web应用中我们更关注的是Web应用每秒能处理的request数量。这个是衡量系统性能的重要指标。
RT指的是响应时间(Response Time),是指从客户端发一个请求开始计时,到客户端接收到从服务器端返回的响应结果结束所经历的时间。
一、RT
响应时间(Response Time),是指从客户端发一个请求开始计时,到客户端接收到从服务器端返回的响应结果结束所经历的时间。
当我们评价一个网站的"快"和"慢"的时候,其说的就是他的RT时间的长和短。当我们访问某个网站,有时候我们会说这个网站很"卡",其实言下之意说的就是这个网站的RT很长。
如果一个网站的RT很长的话,就会特别的影响用户体验。所以,RT是很重要的一个指标。也是各个网站需要重点优化的。
拿一个游乐园的例子来说明一下可能会比较容易理解,比如我们去迪士尼乐园游玩时候,大多数的项目都是需要排队的。
为了能让游客知道一个项目需要排队多久才能玩上,迪士尼做了很多事情,比如他们有一个App,专门可以提示每个项目的预计排队时间。再有就是每个项目的排队伍都有一个小牌匾,上面写着预计排队时间。
但是,这个时间并不是凭空设定出来的,而是『计算』出来的。 迪士尼的排队时间计算方法:
- 迪士尼在每个项目的入口处和出口处都会设置工作人员。
- 入口处工作人员随机寻找游客,给游客一张小纸条,上面记录着游客开始排队的时间。
- 入口处工作人员提醒游客,项目游览之后,在出口处把小纸条交还给出口处的工作人员。
- 出口处工作人员在收到游客的小纸条后,会用:当前时间-游客开始排队的时间 = 排队时长。
- 为了尽量让数据准确,一般会收集多个排队时长之后,计算一个平均值。
以上就是迪士尼的排队时间计算法。其实,这也是RT的计算方法。在一个请求开始的时候记录时间,请求结束的 的时候再记录时间,两个时间的差值,就是RT了。 迪士尼的一个项目的RT包含了多个时间段:排队时间、听项目讲解时间、项目准备时间、项目游玩时间等。 服务器响应时间也有多部分组成,一般包含:请求发送时间、网络传输时间和服务器处理时间等三部分。
二、QPS
QPS,指的是系统每秒能够处理的请求数(Query Per Second),在Web应用中我们更关注的是Web应用每秒能处理的request数量。这个是衡量系统性能的重要指标。有时候,我们也称之为吞吐量。
QPS和RT几乎总是成对出现的。当我们评估某个项目的好坏的时候,通常会包含这几个指标:是否好玩,游玩时长以及可以同时容纳多少人。
这个可以用打个纳祭场的比喻,便可以简单的理解为QPS。很大程度上,一个项目同时可以容纳多少人,实际上大大影响游客的游玩时长。
所以,QPS和RT之间有着一定的关系的(单线程情况下,多线程的话还要再乘一个线程数):
RT = 并发数/QPS
QPS = 并发数/RT
虽然上面的等式看上去,在并发数一定的情况下,想要提升QPS的话就只能降低RT,但其实并不是,以上只是QPS的计算方法。想要提升QPS往往有很多手段。
就像想要提升游乐设施的吞吐量,最首先想到的办法就是升级设备,比如增加游乐场地的面积,增加设备的座位数目,增加排队的队伍个数等等。
在计算机系统中,想要提升QPS,主要可以在CPU、内存等硬件上面下功夫,比如提升CPU利用率,增加CPU数量,提升内存。