当前位置: 首页 > article >正文

[python3]Excel解析库-xlutils

`xlutils` 是一组用于处理 Excel 文件的 Python 库,它实际上是 `xlrd` 和 `xlwt` 的扩展,提供了额外的功能来操作 Excel 文件。`xlutils` 主要由三个部分组成:`xlutils.copy`、`xlutils.filter` 和 `xlutils.view`,它们分别用于复制和修改现有 Excel 文件、过滤数据以及查看 Excel 文件的内容。

 安装

要使用 `xlutils`,首先需要安装它。可以通过 pip 来安装最新版本:

```bash
pip3 install xlutils
```

由于 `xlutils` 依赖于 `xlrd` 和 `xlwt`,确保你也安装了这两个库(注意,对于 `.xls` 文件的支持,`xlrd` 版本应低于2.0.0,因为从2.0.0开始,`xlrd` 不再支持 `.xls` 文件):

```bash
pip install xlrd<2.0.0 xlwt
```

基本用法

#### 使用 `xlutils.copy` 修改现有文件

`xlutils.copy` 允许你读取一个现有的 `.xls` 文件,并创建一个可编辑的副本。然后你可以对这个副本进行修改,最后保存为新的文件或覆盖原文件。

```python
import xlrd
from xlutils.copy import copy

# 打开现有的工作簿
rb = xlrd.open_workbook('example.xls', formatting_info=True)

# 创建副本
wb = copy(rb)

# 获取第一个工作表
sheet = wb.get_sheet(0)

# 修改单元格内容
sheet.write(0, 0, 'Updated Value')

# 保存更改到新文件
wb.save('updated_example.xls')
```

#### 使用 `xlutils.filter` 过滤数据

`xlutils.filter` 提供了一种机制,可以让你通过定义过滤器来自定义处理 Excel 文件的方式。例如,你可以编写一个过滤器来移除空白行或应用特定的格式化规则。

```python
from xlutils.filter import process, XLRDReader, XLWTWriter
from xlrd import open_workbook
from xlwt import Workbook

def remove_blank_rows(record):
    if record.name == 'row':
        if not any(cell.value for cell in record.cells):
            return False
    return True

# 打开现有的工作簿
book = open_workbook('example.xls')

# 设置输入输出处理器
process(
    XLRDReader(book, 'example.xls'),
    XLWTWriter(),
    sheet_records=[remove_blank_rows]  # 应用过滤器
)

# 保存结果到新文件
writer.save('filtered_example.xls')
```

#### 使用 `xlutils.view` 查看文件内容

`xlutils.view` 提供了一些简单的工具来查看 Excel 文件的内容,主要用于调试目的。例如,它可以将 Excel 表格转换为 HTML 格式以便在浏览器中查看。

```python
from xlutils.view import view

# 打开现有的工作簿并查看其内容
view('example.xls')
```

### 注意事项

- `xlutils` 只适用于 `.xls` 文件格式。如果你需要处理 `.xlsx` 文件,请考虑使用其他库如 `openpyxl` 或 `XlsxWriter`。
- 由于 `xlutils` 依赖于 `xlrd` 和 `xlwt`,而这些库已经不再积极维护,因此对于现代项目来说,可能更推荐使用更新的库来进行 Excel 文件的操作。
- 在处理较大文件时,`xlutils` 可能会遇到性能问题,因为它需要将整个文件加载到内存中进行处理。

### 示例:完整代码示例

以下是一个完整的例子,演示了如何使用 `xlutils` 修改现有的 `.xls` 文件并在其中添加新的数据:

```python
import xlrd
from xlutils.copy import copy

def update_excel_file(input_file, output_file):
    # 打开现有的工作簿
    rb = xlrd.open_workbook(input_file, formatting_info=True)

    # 创建副本
    wb = copy(rb)

    # 获取第一个工作表
    sheet = wb.get_sheet(0)

    # 添加新数据
    new_data = [
        ['New Data 1', 'Value 1'],
        ['New Data 2', 'Value 2']
    ]
    start_row = sheet.nrows  # 获取当前行数以确定插入位置

    for row_index, row_data in enumerate(new_data, start=start_row):
        for col_index, value in enumerate(row_data):
            sheet.write(row_index, col_index, value)

    # 保存更改到新文件
    wb.save(output_file)

if __name__ == "__main__":
    input_file = 'example.xls'
    output_file = 'updated_example.xls'
    update_excel_file(input_file, output_file)
```

总结

`xlutils` 是一个有用的工具集,特别适合那些需要频繁读取和修改 `.xls` 文件的项目。然而,考虑到 `xlrd` 和 `xlwt` 的局限性及其缺乏活跃维护的状态,在选择工具时应该权衡项目的长期需求和技术栈的选择。


http://www.kler.cn/a/468303.html

相关文章:

  • ArkTs 状态管理装饰器
  • 极客说|微软 Phi 系列小模型和多模态小模型
  • 04-spring-理-ApplicationContext的实现
  • 回归预测 | MATLAB实ELM-Adaboost多输入单输出回归预测
  • [答疑]用例规约:系统请求3dsMax创建体块
  • SQL—Group_Concat函数用法详解
  • AIA - APLIC之三(附APLIC处理流程图)
  • [读书日志]8051软核处理器设计实战(基于FPGA)第四篇:verilog语法特性
  • 任务执行模式全解析:并发、并行、串行与同步、异步的对比
  • Sentinel-5P遥感数据下载及预处理教程【20250105】
  • 每天学一点强化学习(二)
  • 树莓派 Pico RP2040 多核心运行模式 多核编程
  • 圆周率π为何是无穷无尽的
  • Rust中的Option枚举快速入门
  • LookingGlass使用
  • [react+ts] useRef获取自定义组件dom或方法声明
  • Windows 11 上配置VSCode 使用 Git 和 SSH 完整步骤
  • Go语言的 的反射(Reflection)核心知识
  • springboot远程链接Hadoop
  • launch.json传递True值
  • CSS3 框大小
  • Python基于wordcloud库绘制词云图
  • 基于SpringBoot的旅游网站的设计与实现(源码+数据库+文档)
  • 深入探索:将 Elasticsearch 与 Ruby 工具结合使用
  • Postgresql源码(139)vim直接修改postgresql表文件的简单实例
  • 字玩FontPlayer开发笔记3 性能优化 大量canvas渲染卡顿问题