当前位置: 首页 > article >正文

挑选出行数足够的excel文件

**

遍历文件夹下的所有excel文件,并将数据量超过指定标准的文件拷贝到指定文件夹中

import os.path
import shutil
import pandas as pd


def copy_excel_files(source_folder, target_folder, row_threshold):
    if not os.path.exists(target_folder):
         os.makedirs(target_folder)

    for filename in os.listdir(source_folder):
        if filename.endswith(
                ('.xlsx', '.xls')
        ):
            file_path = os.path.join(source_folder, filename)
            try:
                df = pd.read_excel(file_path)
                if len(df) > row_threshold:
                    target_path = os.path.join(target_folder, filename)
                    shutil.copy2(file_path, target_path)
                    print(f"已复制文件{filename}")
            except Exception as e:
                print(f"处理文件{filename}时出错:{e}")

if __name__ == "__main__":
    # 源文件夹路径
    source_folder = '自定义路径1'
    # 目标文件夹路径
    target_folder = '自定义路径2'
    # 行数阈值,可根据需要修改
    row_threshold = 50

    copy_excel_files(source_folder, target_folder, row_threshold)

http://www.kler.cn/a/553694.html

相关文章:

  • 同步异步日志系统-日志落地模块的实现
  • 【进阶】redis篇
  • 敏捷与DevOps
  • 【设计模式】【创建型模式】建造者模式(Builder)
  • 使用 Redis 实现 RBAC 权限管理
  • Java全栈项目-田径运动会管理系统
  • docker中pull hello-world的时候出现报错
  • DeepSeek与ChatGPT的对比分析
  • Es的text和keyword类型以及如何修改类型
  • 安卓基础(Firebase Cloud Messaging)
  • 图解循环神经网络(RNN)
  • 15-贪心算法
  • stream流常用方法
  • mac os设置jdk版本
  • DeepSeek-V3模型底层架构的核心技术一(多Token预测(MTP)技术)
  • 动态规划之背包问题
  • 力扣-二叉树-235 二叉搜索树的最近公共祖先
  • 位运算,双指针,二分,排序算法
  • 一台服务器将docker image打包去另一天服务器安装这个镜像
  • 2025年02月18日Github流行趋势