当前位置: 首页 > article >正文

匹配一个文件夹下的所有excel——python

匹配一个文件夹下的所有excel——python(这里写自定义目录标题)

下面展示使用OID匹配所有excel文件的 代码片。这里的OID对应你匹配的基准变量。
首先,保证所有文件中都存在OID,且对应的目标样本相同。
然后,将路径(文件保存地址)和OID换成自己的就可以了

#导入相关库
import os
import pandas as pd

# 设置文件夹路径,这里""中改成你自己的路径
excel_folder = r"C:\Users\lenovo\Desktop\map"

# 获取文件夹中所有 Excel 文件
excel_files = [f for f in os.listdir(excel_folder) if f.endswith('.xls') or f.endswith('.xlsx')]

# 初始化一个空的 DataFrame 用于合并所有结果
merged_df = pd.DataFrame()

# 遍历每个 Excel 文件
for excel_file in excel_files:
    try:
        # 构建文件路径
        excel_path = os.path.join(excel_folder, excel_file)

        # 读取 Excel 文件
        df = pd.read_excel(excel_path)

        # 检查是否包含 'OID'if 'OID' in df.columns:
            # 如果是第一个文件,则初始化 merged_df
            if merged_df.empty:
                merged_df = df
            else:
                # 基于 'OID' 列进行合并
                merged_df = pd.merge(merged_df, df, on='OID', how='outer')

            print(f"Successfully processed {excel_file}.")
        else:
            print(f"Warning: 'OID' column not found in {excel_file}. Skipping file.")

    except Exception as e:
        print(f"Error processing {excel_file}: {e}")

# 导出合并后的结果到新的 Excel 文件
output_path = os.path.join(excel_folder, "merged_output.xlsx")
merged_df.to_excel(output_path, index=False)

print(f"All processing complete. Results saved to {output_path}")


http://www.kler.cn/a/472064.html

相关文章:

  • C++网络程序设计
  • 137. 只出现一次的数字 II
  • MYSQL-------------优化MYSQLserver磁盘 I/O 问题及相关优化策略
  • rabbitmq的三个交换机及简单使用
  • 41.6 安装部署,效果测试,架构回顾
  • pytest和unittest的区别
  • 使用 IP 核和开源库减少 FPGA 设计周期
  • Scala语言的循环实现
  • 009:传统计算机视觉之边缘检测
  • Linux 常用命令 - touch 【创建空文件与修改时间戳】
  • 【C语言】可移植性陷阱与缺陷(八): 随机数的大小
  • 如何安装和配置PHP开发环境?
  • apex安装
  • crawl4ai 大模型友好格式输入爬虫框架
  • LLM架构从基础到精通之NLP基础1
  • Java-基于Redisson的Redis工具类RedissonUtils
  • WebSocket 性能优化:从理论到实践
  • 51单片机——中断(重点)
  • 《空舞的巨兽》官方学习版
  • 批量写入数据到数据库,卡顿怎么解决