当前位置: 首页 > article >正文

Apache POI—读写Office格式文件

Apache POI 是一个开源的 Java 库,用于读写 Microsoft Office 格式的文件,主要包括 Excel、Word 和 PowerPoint 等文档。POI 对 Excel 文件的支持最为完善,通过 POI 可以方便地进行 Excel 文件的创建、编辑、读取等操作。

1. Apache POI 简介

Apache POI(Poor Obfuscation Implementation)是专为 Java 提供的 Office 文档处理工具。它包含多个子组件:

  • HSSF(Horrible Spreadsheet Format):用于处理 Excel 97-2003(.xls)格式的文件。
  • XSSF(XML Spreadsheet Format):用于处理 Excel 2007+(.xlsx)格式的文件。
  • HWPF(Horrible Word Processor Format):用于处理 Word 97-2003(.doc)格式的文件。
  • XWPF:用于处理 Word 2007+(.docx)格式的文件。
  • HSLFXSLF:用于处理 PowerPoint 文件。
  • SXSSF(Streaming XSSF):基于 XSSF 的流式 API,适合处理超大数据量的 Excel 文件。

2. 引入 Apache POI 依赖

在 Maven 项目中添加 POI 的依赖,通常只需要引入 Excel 相关的 poi-ooxml 包。

<dependencies>
    <!-- POI 基础包 -->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>3.16</version>
    </dependency>
</dependencies>

3. 基本使用方法

3.1 创建 Excel 文件

import org.apache.poi.ss.usermodel.*;           // 引入通用的 POI Excel 操作类
import org.apache.poi.xssf.usermodel.XSSFWorkbook; // 引入 XSSFWorkbook 类用于创建 .xlsx 格式的工作簿

import java.io.FileOutputStream;

public class ExcelWriter {

    public static void main(String[] args) {
        // 创建一个新的 Excel 工作簿,使用 XSSFWorkbook 创建 .xlsx 格式文件
        Workbook workbook = new XSSFWorkbook();

        // 创建一个名为 "Sheet1" 的工作表
        Sheet sheet = workbook.createSheet("Sheet1");

        // 在工作表中创建第一行 (索引为 0) 并在该行中创建一个单元格 (索引为 0)
        Row row = sheet.createRow(0);         // 创建第一行
        Cell cell = row.createCell(0);        // 在第一行创建第一个单元格

        // 向单元格中写入数据 "Hello, POI!"
        cell.setCellValue("Hello, POI!");     // 设置单元格的值

        // 将工作簿内容输出到指定文件 "example.xlsx" 中
        try (FileOutputStream fos = new FileOutputStream("example.xlsx")) {
            workbook.write(fos);              // 将工作簿写入文件输出流
        } catch (Exception e) {
            e.printStackTrace();              // 捕获并打印异常,避免写入失败时程序崩溃
        }

        // 关闭工作簿以释放资源
        try {
            workbook.close();                 // 关闭工作簿
        } catch (Exception e) {
            e.printStackTrace();              // 捕获并打印异常,避免资源未释放时程序崩溃
        }
    }
}

3.2 读取 Excel 文件

import org.apache.poi.ss.usermodel.*;          // 导入 POI 通用 Excel 操作类
import java.io.FileInputStream;

public class ExcelReader {

    public static void main(String[] args) {
        // 尝试打开文件输入流读取指定的 Excel 文件
        try (FileInputStream fis = new FileInputStream("example.xlsx");
             Workbook workbook = new XSSFWorkbook(fis)) {   // 使用 XSSFWorkbook 读取 .xlsx 文件格式的工作簿

            // 获取 Excel 文件中的第一个工作表,索引从 0 开始
            Sheet sheet = workbook.getSheetAt(0);

            // 遍历工作表中的每一行
            for (Row row : sheet) {
                // 遍历每一行中的每一个单元格
                for (Cell cell : row) {
                    // 根据单元格的数据类型读取并输出相应的数据
                    switch (cell.getCellType()) {
                        case STRING:                         // 若单元格为字符串类型
                            System.out.print(cell.getStringCellValue() + "\t"); // 输出字符串值
                            break;
                        case NUMERIC:                        // 若单元格为数字类型
                            System.out.print(cell.getNumericCellValue() + "\t"); // 输出数值
                            break;
                        default:                             // 其他未知类型
                            System.out.print("未知数据类型\t"); // 输出未知类型提示
                            break;
                    }
                }
                System.out.println();                       // 每读取一行的数据后换行输出
            }
        } catch (Exception e) {
            e.printStackTrace();                            // 捕获并打印异常信息
        }
    }
}

4. 常用操作

4.1 设置单元格样式

// 创建单元格样式对象,用于设置单元格的样式
CellStyle style = workbook.createCellStyle();

// 创建字体对象,用于设置单元格字体的样式
Font font = workbook.createFont();
font.setBold(true);                     // 设置字体加粗
font.setFontHeightInPoints((short) 14); // 设置字体大小为 14 磅

// 将字体样式应用到单元格样式中
style.setFont(font);

// 将样式应用到指定的单元格
cell.setCellStyle(style);               // 设置单元格样式

4.2 合并单元格

import org.apache.poi.ss.util.CellRangeAddress;

sheet.addMergedRegion(new CellRangeAddress(0, 1, 0, 2)); // 合并第 0-1 行,第 0-2 列

4.3 写入日期数据

// 创建一个新的单元格用于存储日期数据,位于当前行的第 2 列(索引 1)
Cell dateCell = row.createCell(1);
dateCell.setCellValue(new Date()); // 设置当前日期作为单元格的值

// 创建单元格样式对象,用于设置日期格式
CellStyle dateStyle = workbook.createCellStyle();

// 设置日期格式为 "yyyy-MM-dd"
// 使用 workbook 的 CreationHelper 创建 DataFormat 对象,并应用自定义格式
dateStyle.setDataFormat(workbook.getCreationHelper().createDataFormat().getFormat("yyyy-MM-dd"));

// 将样式应用到日期单元格,使其显示为指定的日期格式
dateCell.setCellStyle(dateStyle);

4.4 公式计算

Cell formulaCell = row.createCell(2);
formulaCell.setCellFormula("SUM(A1:A10)"); // 设置单元格为求和公式

5. 处理大数据量 Excel 文件

当数据量较大时,SXSSF(Streaming Usermodel API) 是处理大文件的更佳选择。SXSSF 是基于 XSSF 的流式写入方式,适合数据量大的情况下避免内存溢出。

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;

public class LargeExcelWriter {

    public static void main(String[] args) {
        Workbook workbook = new SXSSFWorkbook();
        Sheet sheet = workbook.createSheet("Large Data");

        for (int i = 0; i < 100000; i++) {
            Row row = sheet.createRow(i);
            for (int j = 0; j < 10; j++) {
                Cell cell = row.createCell(j);
                cell.setCellValue("Data " + i + "," + j);
            }
        }

        try (FileOutputStream fos = new FileOutputStream("large_data.xlsx")) {
            workbook.write(fos);
        } catch (Exception e) {
            e.printStackTrace();
        }

        ((SXSSFWorkbook) workbook).dispose(); // 清除临时文件,释放内存
    }
}

6. 总结

Apache POI 是处理 Excel 文件的强大工具,通过 POI 可以实现 Excel 的创建、读取、编辑、写入等操作。小数据量使用 XSSFWorkbook,大数据量使用 SXSSFWorkbook。掌握基本的单元格操作、样式设置、数据格式和公式应用,可以满足绝大多数的 Excel 操作需求。


http://www.kler.cn/a/378061.html

相关文章:

  • MyBatis的插件运行原理,与如何编写一个插件
  • 【UE5 C++课程系列笔记】13——GameInstanceSubsystem的简单使用
  • 探索Flink动态CEP:杭州银行的实战案例
  • 第十七届山东省职业院校技能大赛 中职组“网络安全”赛项任务书正式赛题
  • 人工智能ACA(七)——计算机视觉基础
  • gitlab克隆仓库报错fatal: unable to access ‘仓库地址xxxxxxxx‘
  • HarmonyOS ArkTS Web组件jsbridge
  • Hadoop-002-部署并配置HDFS集群
  • Codeforces Round 981 (Div. 3) (A~F)
  • Java入门10——封装(private)
  • 【Linux】--- 开发工具篇:yum、vim、gcc、g++、gdb、make、makefile
  • 萤石私有化设备视频平台EasyCVR视频融合平台如何构建农业综合监控监管系统?
  • 面试题整理 4
  • 阿里云docker安装禅道记录
  • TCP三次握手,四次挥手,以及11种状态详解
  • Oracle 第17章:数据字典与视图
  • python的数据结构列表方法及扩展(栈和队列)
  • InstructIR: High-Quality Image Restoration Following Human Instructions 论文阅读笔记
  • IDEA 好用的插件分享
  • Blender进阶:贴图与UV
  • 【C++篇】跨越有限与无限的边界:STL之set容器中的自我秩序与无限可能
  • 【踩坑】修复高版本dgl中distributed.load_partition不返回orig_id问题
  • nodejs入门教程19:nodejs dns模块
  • 第三百零五节 Log4j教程 - Log4j日志记录方法
  • Excel常用函数与操作
  • ArcGIS软件之“新建中学最适合地址”地图制作