当前位置: 首页 > article >正文

使用openpyxl轻松操控Excel文件

目录

  • 1. `openpyxl` 简介
  • 2. 安装与快速入门
    • 2.1 安装 `openpyxl`
    • 2.2 快速创建一个 Excel 文件
    • 2.3 读取 Excel 文件
  • 3. `openpyxl` 的核心概念
    • 3.1 工作簿(Workbook)
    • 3.2 工作表(Worksheet)
    • 3.3 单元格(Cell)
    • 3.4 行与列
    • 3.5 范围(Range)
    • 3.6 公式与函数
    • 3.7 样式与格式
  • 4. Excel 文件的读取与写入
    • 4.1 读取 Excel 文件
    • 4.2 写入 Excel 文件
    • 4.3 实践:批量修改单元格
  • 5. 高级功能详解
    • 5.1 操作公式
    • 5.2 添加图表
    • 5.3 插入图片
    • 5.4 数据验证
    • 5.5 条件格式
  • 6. 样式与格式设置
    • 6.1 字体样式
    • 6.2 单元格填充
    • 6.3 边框设置
    • 6.4 对齐方式
    • 6.5 数字格式
    • 6.6 合并与拆分单元格
    • 6.7 实践:制作格式化报表

1. openpyxl 简介

Python 的 openpyxl 库是处理 Excel 文件的强大工具。在数据分析、自动化办公和报告生成等领域,经常需要对 Excel 文件进行读取、修改和创建操作。openpyxl 提供了全面的功能,允许开发者以编程方式操纵 Excel 文件,从而提高工作效率并减少手动操作的错误。

具体来讲,openpyxl 是一个用于读取和写入 Microsoft Excel 2010 xlsx/xlsm/xltx/xltm 文件的开源库。与其他处理 Excel 文件的库相比,openpyxl 专注于对现代 Excel 格式(即基于 XML 的 .xlsx 文件)的支持。

主要特点包括:

  • 读取和写入 Excel 文件:支持对单元格、行、列、工作表和工作簿的操作。
  • 格式化:可以修改单元格的字体、颜色、边框和对齐方式等格式属性。
  • 图表和图片:支持在工作表中插入图表和图片,增强数据的可视化。
  • 公式:能够读取和设置单元格中的公式,支持计算公式结果。

2. 安装与快速入门

2.1 安装 openpyxl

在开始使用 openpyxl 之前,需要先进行安装。可以通过 pip 进行安装:

pip install openpyxl

确保您的 Python 版本在 3.6 及以上,因为较早的版本可能不支持部分功能。

2.2 快速创建一个 Excel 文件

以下是一个使用 openpyxl 创建简单 Excel 文件的示例:

import openpyxl
from openpyxl import Workbook

# 创建一个新的工作簿
wb = Workbook()

# 激活默认的工作表
ws = wb.active

# 在单元格中写入数据
ws['A1'] = 'Hello'
ws['B1'] = 'World!'

# 保存工作簿
wb.save('hello_world.xlsx')

运行上述代码后,将在当前目录下生成一个名为 hello_world.xlsx 的 Excel 文件,内容如下:

AB
HelloWorld!

2.3 读取 Excel 文件

openpyxl 还可以读取已有的 Excel 文件。下面是读取刚才创建的文件并打印单元格内容的示例:

import openpyxl

# 加载已有的工作簿
wb = openpyxl.load_workbook('hello_world.xlsx')

# 选择活动的工作表
ws = wb.active

# 读取并打印单元格内容
print(ws['A1'].value)  # 输出: Hello
print(ws['B1'].value)  # 输出: World!

通过以上简单的示例,我们已经了解了如何使用 openpyxl 创建和读取 Excel 文件。在接下来的章节中,我们将详细介绍 openpyxl 的核心概念和高级功能。

3. openpyxl 的核心概念

在使用 openpyxl 操作 Excel 文件时,需要理解一些核心概念,这将有助于我们更有效地利用该库。

3.1 工作簿(Workbook)

工作簿是 Excel 文件的顶层容器,包含了所有的工作表、全局设置和属性。

  • 创建工作簿wb = Workbook()
  • 加载工作簿wb = load_workbook(filename)

3.2 工作表(Worksheet)

工作簿包含一个或多个工作表,每个工作表都是一个二维的单元格网格。

  • 激活工作表ws = wb.active
  • 创建新工作表ws = wb.create_sheet(title='SheetName')
  • 访问特定工作表ws = wb['SheetName']

3.3 单元格(Cell)

单元格是工作表中的基本元素,包含数据、样式和其他属性。

  • 访问单元格cell = ws['A1']cell = ws.cell(row=1, column=1)
  • 设置单元格值ws['A1'] = 'Data'
  • 获取单元格值value = ws['A1'].value

3.4 行与列

可以通过行和列来批量操作单元格。

  • 迭代行for row in ws.iter_rows(min_row=1, max_col=3, max_row=2):
  • 迭代列for col in ws.iter_cols(min_row=1, max_col=3, max_row=2):

3.5 范围(Range)

范围是指一组连续的单元格,可以对其进行批量操作。

  • 访问范围cell_range = ws['A1:C3']

3.6 公式与函数

可以在单元格中使用公式,openpyxl 支持 Excel 的大部分公式。

  • 设置公式ws['A2'] = '=SUM(A1:A10)'
  • 读取公式结果:需要在 Excel 中打开文件,或使用 data_only 参数加载工作簿。
wb = load_workbook('formula.xlsx', data_only=True)

3.7 样式与格式

openpyxl 提供了丰富的样式和格式选项,可以设置字体、颜色、对齐方式等。

设置字体

from openpyxl.styles import Font
ws['A1'].font = Font(name='Calibri', size=14, bold=True)

设置填充颜色

from openpyxl.styles import PatternFill
ws['A1'].fill = PatternFill(fill_type='solid', start_color='FF0000')

4. Excel 文件的读取与写入

在数据处理过程中,读取和写入 Excel 文件是最常见的操作。openpyxl 提供了简单直观的方法来完成这些任务。

4.1 读取 Excel 文件

加载工作簿

使用 load_workbook 函数加载已有的 Excel 文件:

from openpyxl import load_workbook

wb = load_workbook('data.xlsx')

选择工作表

可以通过多种方式选择工作表:

使用工作表名称:

ws = wb['Sheet1']

使用 active 属性:

ws = wb.active

读取单元格数据

读取单元格的值:

value = ws['A1'].value

或者使用行列索引:

value = ws.cell(row=1, column=1).value

遍历数据

遍历所有行和列:

for row in ws.iter_rows(values_only=True):
    print(row)

4.2 写入 Excel 文件

写入单元格

在特定单元格中写入数据:

ws['A1'] = 'New Data'

或者使用行列索引:

ws.cell(row=1, column=1, value='New Data')

插入行和列

插入一行:

ws.insert_rows(idx=2)

插入一列:

ws.insert_cols(idx=3)

删除行和列

删除一行:

ws.delete_rows(idx=2)

删除一列:

ws.delete_cols(idx=3)

保存工作簿

完成所有修改后,保存工作簿:

wb.save('modified_data.xlsx')

4.3 实践:批量修改单元格

假设我们有一个成绩表,需要将所有学生的成绩提高 5 分。

from openpyxl import load_workbook

wb = load_workbook('scores.xlsx')
ws = wb.active

# 假设成绩在 B 列,从第 2 行开始
for row in ws.iter_rows(min_row=2, min_col=2, max_col=2):
    for cell in row:
        if isinstance(cell.value, (int, float)):
            cell.value += 5

wb.save('updated_scores.xlsx')

通过以上操作,我们成功地批量修改了 Excel 文件中的数据。

5. 高级功能详解

openpyxl 不仅可以进行基本的读取和写入操作,还提供了许多高级功能,例如图表、图片和数据验证等。

5.1 操作公式

可以在单元格中写入公式:

ws['A10'] = '=SUM(A1:A9)'

openpyxl 不会自动计算公式结果,但可以通过设置 data_only=True 来读取公式计算后的值:

wb = load_workbook('formula.xlsx', data_only=True)
ws = wb.active
print(ws['A10'].value)

5.2 添加图表

以创建柱状图为例:

from openpyxl.chart import BarChart, Reference

chart = BarChart()
data = Reference(ws, min_col=2, min_row=1, max_row=10)
chart.add_data(data, titles_from_data=True)
ws.add_chart(chart, 'E5')

可以设置图表的标题、轴标签等属性:

chart.title = "Sales Chart"
chart.x_axis.title = "Month"
chart.y_axis.title = "Sales"

5.3 插入图片

from openpyxl.drawing.image import Image

img = Image('logo.png')

添加图片到工作表:

ws.add_image(img, 'A1')

5.4 数据验证

可以添加数据验证来限制单元格的输入内容。

创建数据验证对象

from openpyxl.worksheet.datavalidation import DataValidation

dv = DataValidation(type="whole", operator="between", formula1=1, formula2=100)

添加数据验证到工作表

dv.add('A1:A10')
ws.add_data_validation(dv)

5.5 条件格式

根据单元格的值,动态地改变单元格的格式。

创建条件格式规则

from openpyxl.formatting.rule import CellIsRule
from openpyxl.styles import PatternFill

red_fill = PatternFill(start_color='FFC7CE', end_color='FFC7CE', fill_type='solid')

ws.conditional_formatting.add('A1:A10', CellIsRule(operator='greaterThan', formula=['80'], fill=red_fill))

通过以上高级功能的介绍,可以看出 openpyxl 在处理 Excel 文件时具有非常强大的能力,足以满足大多数复杂的需求。

6. 样式与格式设置

为了使 Excel 文件更加美观和专业,openpyxl 提供了丰富的样式和格式设置选项。

6.1 字体样式

设置字体

from openpyxl.styles import Font

bold_font = Font(bold=True)
italic_font = Font(italic=True)

ws['A1'].font = bold_font
ws['A2'].font = italic_font

设置字体颜色和大小

from openpyxl.styles import Font, colors

font_style = Font(color=colors.RED, size=14, name='Arial')
ws['A1'].font = font_style

6.2 单元格填充

设置背景颜色

from openpyxl.styles import PatternFill

fill = PatternFill(fill_type='solid', start_color='FFFF00', end_color='FFFF00')
ws['A1'].fill = fill

6.3 边框设置

添加边框

from openpyxl.styles import Border, Side

thin_border = Border(left=Side(style='thin'),
                     right=Side(style='thin'),
                     top=Side(style='thin'),
                     bottom=Side(style='thin'))

ws['A1'].border = thin_border

6.4 对齐方式

设置对齐方式

from openpyxl.styles import Alignment

alignment = Alignment(horizontal='center', vertical='center')
ws['A1'].alignment = alignment

6.5 数字格式

设置数字格式

ws['A1'].number_format = '0.00'  # 保留两位小数

6.6 合并与拆分单元格

合并单元格

ws.merge_cells('A1:C1')

拆分单元格

ws.unmerge_cells('A1:C1')

6.7 实践:制作格式化报表

from openpyxl import Workbook
from openpyxl.styles import Font, Alignment, Border, Side

wb = Workbook()
ws = wb.active

# 写入表头
headers = ['姓名', '数学', '英语', '总分']
ws.append(headers)

# 添加数据
data = [
    ['张三', 85, 92],
    ['李四', 78, 88],
    ['王五', 90, 95]
]

for row in data:
    total = row[1] + row[2]
    row.append(total)
    ws.append(row)

# 设置表头样式
for cell in ws[1]:
    cell.font = Font(bold=True)
    cell.alignment = Alignment(horizontal='center')
    cell.border = Border(bottom=Side(style='thin'))

# 设置列宽
ws.column_dimensions['A'].width = 15
for col in ['B', 'C', 'D']:
    ws.column_dimensions[col].width = 10

# 保存工作簿
wb.save('report.xlsx')

通过以上代码,我们生成了一个格式化的成绩报表,包含表头加粗、单元格对齐、边框和列宽设置。


http://www.kler.cn/a/325434.html

相关文章:

  • 类与对象;
  • HBase压测 ycsb
  • docker部署bitnami/etcd:latest
  • Spark RDD sortBy算子什么情况会触发shuffle
  • 深度神经网络DNN反向传播BP算法公式推导
  • Spring boot + Vue2小项目基本模板
  • C++学习笔记(48)
  • grafana加载缓慢解决方案
  • 初学playbook,从一个简单的示例开始。
  • Vue前端浏览器指纹获取:数字世界的身份密码
  • linux常见指令与权限【第四课】
  • C语言基本语法————基本数据类型、变量与常量
  • HDFS组件相关问题-持续更新
  • Growthly Quest 增长工具:助力 Web3 项目实现数据驱动的增长
  • RTE 大会报名丨AI 时代新基建:云边端架构和 AI Infra ,RTE2024 技术专场第二弹!
  • 【在Linux世界中追寻伟大的One Piece】进程间通信
  • 在Windows on Arm上使用Electron构建桌面应用
  • Rust和Go谁会更胜一筹
  • Day28笔记-Python自动化操作Word
  • Redis结合Caffeine实现二级缓存:提高应用程序性能
  • 计算机组成原理之数制与编码
  • 交通标志与路面标识检测系统源码分享
  • linux 系统磁盘空间查看与清理
  • 基于nodejs+vue的旅游管理系统
  • 【OS】计算机系统概述|操作系统基本概念|并发|并行|虚拟异步
  • 如何在O2OA中使用ElementUI组件进行审批流程工作表单设计