当前位置: 首页 > article >正文

【Java异步编程】基于任务类型创建不同的线程池

文章目录

    • 一. 按照任务类型对线程池进行分类
      • 1. IO密集型任务的线程数
      • 2. CPU密集型任务的线程数
      • 3. 混合型任务的线程数
    • 二. 线程数越多越好吗
    • 三. Redis 单线程的高效性

使用线程池的好处主要有以下三点:

  1. 降低资源消耗:线程是稀缺资源,如果无限制地创建,不仅会消耗系统资源,还会降低系统的稳定性,通过重复利用已创建的线程可以降低线程创建和销毁造成的消耗。
  2. 提高响应速度:当任务到达时,可以不需要等待线程创建就能立即执行。
  3. 提高线程的可管理性:线程池提供了一种限制、管理资源的策略,维护一些基本的线程统计信息,如已完成任务的数量等。通过线程池可以对线程资源进行统一的分配、监控和调优。

虽然使用线程池的好处很多,但是如果其线程数配置得不合理,不仅可能达不到预期效果,反而可能降低应用的性能。接下来按照不同的任务类型来配置线程池。

 

一. 按照任务类型对线程池进行分类

使用标准构造器ThreadPoolExecutor创建线程池时,会涉及线程数的配置,而线程数的配置与异步任务类型是分不开的。这里将线程池的异步任务大致分为以下三类:

  1. IO密集型任务此类任务主要是执行IO操作。由于执行IO操作的时间较长,导致CPU的利用率不高,这类任务CPU常处于空闲状态。Netty的IO读写操作为此类任务的典型例子。
  2. CPU密集型任务此类任务主要是执行计算任务。由于响应时间很快,CPU一直在运行,这种任务CPU的利用率很高。
  3. 混合型任务此类任务既要执行逻辑计算,又要进行IO操作(如RPC调用、数据库访问)​。

相对来说,由于执行IO操作的耗时较长(一次网络往返往往在数百毫秒级别)​,这类任务的CPU利用率也不是太高。Web服务器的HTTP请求处理操作为此类任务的典型例子。一般情况下,针对以上不同类型的异步任务需要创建不同类型的线程池,并进行针对性的参数配置。

 

1. IO密集型任务的线程数

由于IO密集型任务的CPU使用率较低,导致线程空余时间很多,因此通常需要开CPU核心数两倍的线程。当IO线程空闲时,可以启用其他线程继续使用CPU,以提高CPU的使用率。

@Slf4j  
//懒汉式单例创建线程池:用于IO密集型任务  
public class IoIntenseTargetThreadPoolLazyHolder {  
  
    /**  
     * IO线程池最大线程数  
     */  
    public static final int IO_MAX = Math.max(2, CPU_COUNT * 2);  
  
  
    /**  
     * 空闲保活时限,单位秒  
     */  
    public static final int KEEP_ALIVE_SECONDS = 30;  
  
  
    /**  
     * 有界队列size  
     */    
    public static final int QUEUE_SIZE = 10000;  
  
      
      
    //线程池: 用于IO密集型任务  
    public static final ThreadPoolExecutor EXECUTOR = new ThreadPoolExecutor(  
            IO_MAX,  
            IO_MAX,  
            KEEP_ALIVE_SECONDS,  
            TimeUnit.SECONDS,  
            new LinkedBlockingQueue(QUEUE_SIZE),  
            new ThreadUtil.CustomThreadFactory("io"));  
  
    public static ThreadPoolExecutor getInnerExecutor() {  
        return EXECUTOR;  
    }  
  
    static {  
        log.info("线程池已经初始化");  
  
        EXECUTOR.allowCoreThreadTimeOut(true);  
        //JVM关闭时的钩子函数  
        Runtime.getRuntime().addShutdownHook(  
                new ShutdownHookThread("IO密集型任务线程池", new Callable<Void>() {  
                    @Override  
                    public Void call() throws Exception {  
                        //优雅关闭线程池  
                        shutdownThreadPoolGracefully(EXECUTOR);  
                        return null;  
                    }  
                }));  
    }  
}

 

有以下几点需要注意

  1. 调用allowCoreThreadTimeOut,传入了参数true,应用于核心线程,当池中的线程长时间空闲时,可以自行销毁。
  2. 使用有界队列缓冲任务而不是无界队列,如果128太小,可以根据具体需要进行增大,但是不能使用无界队列。
  3. corePoolSize和maximumPoolSize保持一致,使得在接收到新任务时,如果没有空闲工作线程,就优先创建新的线程去执行新任务,而不是优先加入阻塞队列,等待现有工作线程空闲后再执行。
  4. 使用JVM关闭时的钩子函数优雅地自动关闭线程池。

 

2. CPU密集型任务的线程数

CPU密集型任务也叫计算密集型任务,其特点是要进行大量计算而需要消耗CPU资源,比如计算圆周率、对视频进行高清解码等。

CPU密集型任务虽然也可以并行完成,但是并行的任务越多,花在任务切换的时间就越多,CPU执行任务的效率就越低,所以要最高效地利用CPU,CPU密集型任务并行执行的数量应当等于CPU的核心数。

/**  
 * CPU核数  
 **/  
public static final int CPU_COUNT = Runtime.getRuntime().availableProcessors();  
  
public static final int MAXIMUM_POOL_SIZE = CPU_COUNT;  
  
//线程池: 用于CPU密集型任务  
private static final ThreadPoolExecutor EXECUTOR = new ThreadPoolExecutor(  
        MAXIMUM_POOL_SIZE,  
        MAXIMUM_POOL_SIZE,  
        KEEP_ALIVE_SECONDS,  
        TimeUnit.SECONDS,  
        new LinkedBlockingQueue(QUEUE_SIZE),  
        new CustomThreadFactory("cpu"));  
  
  
public static ThreadPoolExecutor getInnerExecutor() {  
    return EXECUTOR;  
}  
  
static {  
    log.info("线程池已经初始化");  
  
    EXECUTOR.allowCoreThreadTimeOut(true);  
    //JVM关闭时的钩子函数  
    Runtime.getRuntime().addShutdownHook(  
            new ShutdownHookThread("CPU密集型任务线程池", new Callable<Void>() {  
                @Override  
                public Void call() throws Exception {  
                    //优雅关闭线程池  
                    shutdownThreadPoolGracefully(EXECUTOR);  
                    return null;  
                }  
            }));  
}

 

3. 混合型任务的线程数

混合型任务既要执行逻辑计算,又要进行大量非CPU耗时操作(如RPC调用、数据库访问、网络通信等)​,所以混合型任务CPU的利用率不是太高,非CPU耗时往往是CPU耗时的数倍

比如在Web应用中处理HTTP请求时,一次请求处理会包括DB操作、RPC操作、缓存操作等多种耗时操作。一般来说,一次Web请求的CPU计算耗时往往较少,大致在100~500毫秒,而其他耗时操作会占用500~1000毫秒,甚至更多的时间。

在为混合型任务创建线程池时,如何确定线程数呢?业界有一个比较成熟的估算公式,具体如下:


最佳线程数 = ((线程等待时间+线程CPU时间) / 线程CPU时间) * CPU核数

通过公式可以看出:等待时间所占的比例越高,需要的线程就越多;CPU耗时所占的比例越高,需要的线程就越少

 

下面举一个例子:

比如在Web服务器处理HTTP请求时,假设平均线程CPU运行时间为100毫秒,而线程等待时间(比如包括DB操作、RPC操作、缓存操作等)为900毫秒,如果CPU核数为8,那么根据上面这个公式,估算如下:

900毫秒 + 100毫秒) / 100毫秒 * 8 = 10 * 8 = 80

 

二. 线程数越多越好吗

很多小伙伴认为,线程数越高越好。那么,使用很多线程是否就一定比单线程高效呢?答案是否定的。

虽然多线程在一些并发场景下能带来性能提升,但过多的线程并不意味着性能必定提升。线程数过高可能导致一些问题:

  • 上下文切换(Context Switching): 每个线程的执行都由操作系统调度,线程切换会带来额外的开销。当线程数过多时,操作系统频繁地在不同线程间切换,导致 上下文切换 成本增加,这样反而可能降低系统的整体效率。

  • 资源争用: 多线程同时访问共享资源时,可能会遇到 资源竞争锁竞争,特别是在 CPU 绑定的任务中。线程之间的协作和同步会称为性能瓶颈。

  • 内存开销: 每个线程需要占用一定的内存,维护线程栈、调度信息等,过多的线程会消耗大量的内存和系统资源,这可能会导致系统性能下降,甚至造成内存溢出

 

三. Redis 单线程的高效性

Redis 是一个 单线程 的高性能数据库,许多人可能会觉得它的设计不合常理,为什么不使用多线程来提升性能呢?然而,Redis 使用单线程反而能够达到极高的吞吐量,这是因为:

特点核心内容
1. 避免多线程上下文切换单线程模型避免了线程切换的开销,任务按顺序处理,简化了并发控制,避免了锁竞争和死锁问题。
2. 非阻塞设计采用事件驱动和 I/O 多路复用技术,非阻塞处理请求。如果一个请求需要等待外部资源(如网络 I/O),Redis 会把控制权交给其他请求,而不是阻塞线程。这种方式避免了多线程中因为等待 I/O 资源导致的线程空闲,充分利用了 CPU 的时间片。
3. CPU vs I/O 密集型Redis 的大多数操作(如 GET/SET)是 I/O 密集型 的,单线程在 I/O 密集型应用中有优势。
4. 数据访问模式Redis 操作主要是内存访问,内存操作速度快,单线程执行时没有同步问题,数据结构(如哈希表、跳表等)高效。

http://www.kler.cn/a/527967.html

相关文章:

  • C++并行化编程
  • 01.04、回文排序
  • 【深度分析】DeepSeek 遭暴力破解,攻击 IP 均来自美国,造成影响有多大?有哪些好的防御措施?
  • Linux Samba 低版本漏洞(远程控制)复现与剖析
  • Flutter使用Flavor实现切换环境和多渠道打包
  • [C语言日寄] <stdio.h> 头文件功能介绍
  • Python-基于mediapipe,pyautogui,cv2和numpy的电脑手势截屏工具(进阶版)
  • 【Rust】18.2. 可辩驳性:模式是否会无法匹配
  • Python 梯度下降法(五):Adam Optimize
  • Java动态代理:原理与实现
  • 家庭财务管理系统的设计与实现
  • Spring的设计理念之IOC
  • 软件渲染器tinyrenderer
  • OpenCV:SIFT关键点检测与描述子计算
  • caddy2配置http_basic用于验证用户名密码才允许访问页面
  • 代码随想录|动态规划1143.最长公共子序列 1035.不相交的线 53. 最大子序和 392.判断子序列
  • 零代码搭建个人博客—Zblog结合内网穿透发布公网
  • 2025 年,链上固定收益领域迈向新时代
  • I.MX6ULL 中断介绍上
  • 推荐一款好看的Typora主题页面
  • MATLAB R2023b下载与安装教程
  • MongoDb user自定义 role 添加 action(collStats, EstimateDocumentCount)
  • 【MATLAB例程】TOA和AOA混合的高精度定位程序,适用于三维、N锚点的情况
  • 【vue项目权限控制方案】
  • Linux stat 命令使用详解
  • 内部知识库提升组织效率与知识共享助力业务快速发展