当前位置: 首页 > article >正文

【代码记录】多线程示例代码

用多线程处理多gpu模型输入的时候写的,感觉复用性会很不错,用以记录和分享

import threading
def multithreadhelper(workfn,alldata:list,number:int):
    # workfn takes only one argument: a example of alldata
    # data preparation
    def chunk_data(data, chunksize):  
        for i in range(0, len(data), chunksize):  
            yield data[i:i + chunksize] 
    chunk_size = (len(alldata)+number-1) // number
    if chunk_size == 0:  
        chunk_size = 1
    chunks = list(chunk_data(alldata, chunk_size))  
    # multi thread logic
    global results
    results = []
    results_lock = threading.Lock()
    def workgroupfn(datalist):
        localresults = [workfn(datapoint) for datapoint in datalist]
        with results_lock:
            results.extend(localresults)
    threads = []
    for chunk in chunks:
        thread = threading.Thread(target=workgroupfn,args=(chunk,))
        threads.append(thread)
        thread.start()
    for thread in threads:
        thread.join()
    return results

GPT-4o对代码的解释如下:

这个代码定义了一个名为 multithreadhelper 的函数,它的作用是并行处理数据列表 alldata 中的每个元素,使用指定的工作函数 workfn 来处理数据。在多线程环境中进行数据处理可以提高效率,特别是在数据量大或者计算过程较为复杂的情况下。

下面是代码中的关键部分及其功能的简要说明:

  • 数据分块:

使用 chunk_data 函数将 alldata 划分为多个小块(chunk)。每个块的大小由 number 参数决定,表示要使用的线程数量。
chunk_size 计算分块的大小,确保所有数据都能被处理。

  • 多线程设置:

使用全局变量 results 来存储最终的处理结果,并使用 results_lock 来确保在多线程环境中对 results 的访问是线程安全的。
在 workgroupfn 函数中,传递的每个数据块(datalist)中的每个数据点都通过工作函数 workfn 进行处理,并将处理结果存储在 localresults 中。随后,使用锁将这些结果合并到全局的 results 列表中。
创建并启动线程:

为每个数据块创建一个线程,将其指向 workgroupfn 函数,并传入相应的数据块。在启动线程后,函数会等待所有线程完成(通过 thread.join())。
返回结果:

最后,返回合并后的 results,即所有数据点经过 workfn 处理后的结果列表。
简单来说,这段代码的主要功能是:通过将数据分块并使用多个线程并行处理这些块来提高数据处理的效率。


http://www.kler.cn/a/330030.html

相关文章:

  • 【WPF】Prism学习(八)
  • 博客园-awescnb插件-geek皮肤优化-样式优化
  • linux004.在ubuntu中smb.conf配置文件中配置内容详解
  • 高效工具推荐:基于WebGPU的Whisper Web结合内网穿透远程使用指南
  • MySQL45讲 第二十四讲 MySQL是怎么保证主备一致的?——阅读总结
  • 【微信小程序】访客管理
  • C语言+单片机
  • docker -私有镜像仓库 - harbor安装
  • 10.4 Linux_并发_线程
  • 深入探讨 Docker:远程登录与镜像管理
  • C++容器之list基本使用
  • 上海我店:创新模式引领本地生活新风尚
  • c#使用winscp库实现FTP/SFTP/SCP的获取列表、上传和下载功能
  • 大数据比懂知识点:Parquet、ORC还是Avro作为数据存储格式,哪种在性能和压缩率上更优
  • 【C++二分查找 前缀和】1712. 将数组分成三个子数组的方案数|2078
  • 深入解析开源大模型的GPU资源需求与优化策略
  • 程序员如何通过专业与软技能提升核心竞争力
  • 特权访问管理阻力最小的途径
  • 付费计量系统通用功能(9)
  • 企望制造ERP系统存在RCE漏洞
  • UniVue大版本更新:UniVue2.0.0-preview
  • 10月2日笔记(内网资源探测篇)
  • 前端的全栈混合之路Meteor篇:运行在浏览器端的数据库-MiniMongo介绍及其前后端数据实时同步示例
  • 矩阵系统源码搭建,OEM贴牌,源头技术开发
  • 前端的全栈混合之路Meteor篇:3.0新版本介绍
  • vscode使用yarn 启动vue项目记录