当前位置: 首页 > article >正文

Python知识点:如何使用Python进行Excel文件操作(OpenPyXL、Pandas)

在 Python 中,处理 Excel 文件常用的库有 OpenPyXLPandas。它们各自适合不同的使用场景:

  1. OpenPyXL

    • 主要用于操作 .xlsx 格式的 Excel 文件。
    • 适合对 Excel 文件进行格式设置公式图表等功能的处理。
    • 更多偏向 Excel 文档的原生功能操作。
  2. Pandas

    • 更适合处理表格型数据,如读取、分析、修改数据。
    • 可以非常方便地进行数据处理,如筛选、排序、数据聚合等操作。

以下是如何使用这两个库进行常见操作的示例:

安装所需库

pip install openpyxl pandas

1. 使用 OpenPyXL 操作 Excel 文件

基本操作:读取和写入

from openpyxl import load_workbook, Workbook

# 读取 Excel 文件
wb = load_workbook('example.xlsx')
sheet = wb.active  # 获取活跃的 sheet,或通过 sheet 名字 wb['Sheet1'] 来获取

# 读取单元格数据
cell_value = sheet['A1'].value
print(cell_value)

# 修改单元格数据
sheet['A1'] = "New Value"

# 保存更改
wb.save('example_modified.xlsx')

创建一个新的 Excel 文件并写入数据

# 创建新的工作簿
wb = Workbook()
sheet = wb.active

# 写入数据
sheet['A1'] = 'Hello'
sheet['A2'] = 'World'

# 保存工作簿
wb.save('new_file.xlsx')

添加多个 sheet

# 创建一个新的 sheet
wb.create_sheet(title="Sheet2")

# 选择新的 sheet
sheet2 = wb["Sheet2"]
sheet2['A1'] = "Data in Sheet2"

# 保存
wb.save('new_file_with_multiple_sheets.xlsx')

2. 使用 Pandas 操作 Excel 文件

读取 Excel 文件

import pandas as pd

# 读取 Excel 文件中的第一个 sheet
df = pd.read_excel('example.xlsx')

# 查看前几行数据
print(df.head())

将 DataFrame 写入到 Excel 文件

# 创建一个 DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35]
}
df = pd.DataFrame(data)

# 将 DataFrame 保存为 Excel 文件
df.to_excel('output.xlsx', index=False)  # index=False 去掉 DataFrame 的行索引

读取和写入多个 sheet

# 读取 Excel 文件的特定 sheet
df_sheet2 = pd.read_excel('example.xlsx', sheet_name='Sheet2')

# 写入多个 sheet 到 Excel 文件
with pd.ExcelWriter('output_multiple_sheets.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, sheet_name='Sheet1')
    df_sheet2.to_excel(writer, sheet_name='Sheet2')

数据处理

Pandas 更适合进行数据处理操作,比如过滤、分组、聚合等:

# 过滤数据
filtered_df = df[df['Age'] > 30]

# 分组聚合
grouped = df.groupby('Age').sum()

# 打印结果
print(filtered_df)
print(grouped)

两者对比

  • OpenPyXL 更适合需要对 Excel 文件的格式单元格样式图表等进行操作的场景。
  • Pandas 更擅长处理大规模数据、进行复杂的数据分析和处理,但它不处理 Excel 的格式和样式。

总结

根据实际需要选择库:

  • 如果你只是读取和处理数据,Pandas 更方便快捷。
  • 如果需要对 Excel 文件的格式图表等进行操作,OpenPyXL 更适合。

希望这些例子能帮助你了解如何使用 Python 来处理 Excel 文件。如果有更多问题,欢迎继续讨论!


http://www.kler.cn/news/304177.html

相关文章:

  • 源码到class字节码的编译流程 字节码到内存的Java类加载流程
  • 【一分钟学C++】std::memory_order
  • Vue3+Django5+REST Framework开发电脑管理系统
  • 【计算机网络 - 基础问题】每日 3 题(一)
  • 程序的结构和控制流与数据流
  • MySQL 表的增删改查
  • 注解(Java程序的一种特殊“注释”,用于工具处理的标注)
  • 每日一问:C++ 中重写和重载的区别
  • vue3 5个常用的API
  • SpringBoot开发——整合Spring Data MongoDB
  • [数据集][目标检测]车油口挡板开关闭合检测数据集VOC+YOLO格式138张2类别
  • 凸优化学习(2)——梯度类方法求解(gradient descent)
  • 构建有温度的用户关系:开源 AI 智能名片、链动 2+1 模式与 S2B2C 商城小程序的作用
  • 华为SMU02B1管理模块WEB登录与账户密码信息
  • HTB-Archetype(winPEAS枚举工具,mssql xp_cmdshell)
  • Linux - make/Makefile工具的基础使用
  • Java的发展史与前景
  • 贪吃蛇项目实现(C语言)——附源码
  • JavaScript知识点3
  • JMeter脚本开发
  • 人工智能领域的性能指的是什么
  • Unity3D类似于桌面精灵的功能实现
  • JDK 17 微服务启动JVM参数调优实战
  • 自学前端靠谱吗?
  • onRequestPermissionsResult详解
  • 多账号注册脚本不会被平台监控吗
  • 写论文还在卡壳?教你用ChatGPT轻松搞定过渡段落!
  • Google大数据架构技术栈
  • 91-java cms垃圾回收器
  • java 长连接中的sse与websocket含义, 两者的区别