当前位置：首页 > article >正文

如何将pdf文件中的指定页提取出来，另存为新的pdf文件

article 2025/2/28 15:52:51

工作中，我们有时需要将pdf文件中的指定页提取出来，另存为新的pdf文件。

例如：我想提取 example.pdf 的第 [3, 6, 9] 页，然后另存为 new.pdf 。话不多说，上代码：

import PyPDF2
 
def split_pdf(input_pdf_path, choose_pages):
    with open(input_pdf_path, 'rb') as file:
        reader = PyPDF2.PdfReader(file)
        output_pdf_path = f"new.pdf"
        writer = PyPDF2.PdfWriter()
        for page_number in choose_pages:
            writer.add_page(reader.pages[page_number - 1])
            with open(output_pdf_path, 'wb') as output_file:
                writer.write(output_file)
 
# 使用示例
input_pdf_path = 'example.pdf'  # 输入的PDF文件路径
choose_pages = [3, 6, 9]
split_pdf(input_pdf_path, choose_pages)

如果你还没有安装 PyPDF2，请安装

pip install PyPDF2

http://www.kler.cn/a/516486.html

相关文章：

【C】链表算法题4 -- 合并两个有序链表

Spring MVC：深入理解与春招面试要点

Jenkins邮件通知的详细配置含邮件通知模板！

MyBatis-Plus的插件

如何查找pom文件未使用的依赖

窥探QCC518x-308x系列与手机之间的蓝牙HCI记录与分析 - 耳机篇

RabbitMQ2-简单案例

JVM深入学习（一）

尚硅谷大数据数仓项目superset db upgrade报错解决（2025.1.23解决）

云原生时代，如何构建高效分布式监控系统

OSCP - Proving Grounds - Quackerjack

C语言小任务——寻找水仙花数

springboot基于微信小程序的商城系统

CPU中断机制

Ubuntu 24.04 LTS 通过 docker desktop 安装 seafile 搭建个人网盘

分词器的词表大小以及如果分词器的词表比模型的词表大，那么模型的嵌入矩阵需要被调整以适应新的词表大小。

MySQL命令及用法（精华版）

接口 V2 完善：基于责任链模式、Canal 监听 Binlog 实现数据库、缓存的库存最终一致性

2024 行远自迩，笃行不怠

Geek Uninstaller，绿色免安装轻量的应用卸载工具！