当前位置: 首页 > article >正文

从nas硬盘大量解压缩zip文件的性能问题

“计算机科学领域的任何问题都可以通过增加一个间接的中间层来解决.”

一个名人说的,也是我们解决问题主要的一种方式。我们总是想设计做到“透明”。提供很高的服务给下一层服务,你不需要管中间的细节,你调用就好了。

不会存在只有一面的硬币。记得读书的时候,计算机历史中就有人想把API调用都设计成一样的,本地调用和网络调用看起来是一样的,但是这期间的时间差,如果不仔细考虑,那么上层的代码就无法使用。(如果是网络调用,你需要读取很大的内容来反复处理,如果是从内存读取内容,就可以把代码写的更好读,一次一次遍历。)

这次的任务是在Linux服务器上,有很多zip文件需要进行解压缩任务,然后再copy到另一台nas机器上。文件一共是几百万左右,最开始就没什么都没想,只把工程完成就好了。然后就交给机器去跑。

但是第二天发现,工作的很慢,然后没想太多,想提供多线程去优化。反正就是改写到10个线程同时处理。然后发现还是没有想象的快。一直认为是apache zip是不是有什么性能问题。不理解为什么他们这么菜。哈哈

其实这里面还是涉及到太多的底层,有自己无法理解的地方。问了一下人工智能。它给出的方案是先copy到本地,然后再加压缩到目标nas。

我还是理解不了上诉方案,因为copy到本地在解压缩,就相当于。Nas硬盘->内存->网络->本机内存->本地硬盘。 然后再解压缩。

如果直接取数据不是相当于Nas硬盘->内存->网络->本机内存-> 然后直接处理了。减少了本机写硬盘的时间。(这个问题之前遇到过,也没想通。)

后来想看看nas的底层原理,使用mount看了一下是使用的什么协议。

xx.xxx.xxx.xxx:/ /SFTP on /xxxx type nfs4 (rw,relatime,vers=4.1,rsize=1048576,wsize=1048576,namlen=255,hard,proto=tcp,timeo=600,retrans=2,sec=sys,clientaddr=10.67.38.149,local_lock=none,addr=xx.xxx.xxx.xxx)

这是NFS协议的具体细节:

  • 协议版本: NFS v4.1(通过 vers=4.1 指定)。
  • 传输协议: 使用 TCP(通过 proto=tcp 指定)。
  • 其他选项:
    • /写大小: rsize=1048576, wsize=1048576(每次读写数据块大小为1MB)。
    • 超时和重传: timeo=600, retrans=2(传输超时时间和重传次数)。
    • 安全: sec=sys(表示基于系统的安全方式)。

总之,所有的挂载路径都使用了NFS v4.1协议来进行网络存储访问。

看了以后发现自己的代码

byte[] buffer = new byte[1024];
try (ZipFile zipFile = new ZipFile(file)) {

使用的是1k的缓冲,但是nas使用的是1M的缓冲,那么用脑子想想(还没有进行验证)应该是造成了nas缓冲的大量浪费。如果把代码里面的缓冲设置成大于或者等于nas的缓冲就大可以大幅度提高效率。回来有机会可以试一下这次猜想。

还有就是任何一层都无法做到完全透明,如果你想做好,那么你就需要了解底层原理。但是还是会减少了大量的编码成本。而且在不在意效率的情况下,普遍还是工作很好的。


http://www.kler.cn/a/354154.html

相关文章:

  • 分布式协同 - 分布式事务_2PC 3PC解决方案
  • 基于kraft部署kafka集群
  • 聊天社交管理系统 Java 源码,构建个性化社交空间
  • QT-基础-1-Qt 中的字符串处理与常见数据类型
  • kimi搜索AI多线程批量生成txt原创文章软件-不需要账号及key
  • Issac ROS navigation测试
  • COSCon'24 志愿者招募令:共创开源新生活!
  • 语音信号去噪 Matlab语音信号去噪,GUI界面。分别添加了正弦噪声和高斯噪声,分别用了巴特沃斯低通滤波器和小波分解去噪。每步处理都可以播放出信号声音。
  • 鸿蒙开发 四十五 鸿蒙状态管理(嵌套对象界面更新)
  • 【论文#性能对比】Video coding with H.264/AVC: Tools, Performance, and Complexity
  • 《太吾绘卷》风灵月影游戏辅助好不好用?《太吾绘卷》风灵月影游戏辅助功能 全解析
  • stm32 单片机使用 rt-thread 的syswatch 系统守护软件包
  • 27.第二阶段x86游戏实战2-遍历周围NPC跳出递归循环
  • Unity3D Shader预热生成详解
  • Vue 之 插件与组件的区别
  • appium启动hbuild打包的apk异常解决
  • Raid盘类型及其特点
  • Flask框架@app.route中的路径及其视图函数
  • 如何有效参与机器人顶会?——周易教授PRE-IROS 2024分享
  • 【数据分析】影响系数 =(今日量-昨日量)/(今日总量-昨日总量)
  • git 操作暂存区命令用法大全
  • ChatGPT 现已登陆 Windows 平台
  • html和css实现页面
  • 文件加密技术解析:守护敏感信息的第一道防线
  • 技术分享:A-23OH型树脂在汽车涂装废溶剂回收中的应用
  • YOLOv11改进策略【卷积层】| SPD-Conv 针对小目标和低分辨率图像的检测任务