当前位置: 首页 > article >正文

如何将pdf文件中的指定页提取出来,另存为新的pdf文件

工作中,我们有时需要将pdf文件中的指定页提取出来,另存为新的pdf文件。

例如:我想提取 example.pdf 的第 [3, 6, 9] 页,然后另存为 new.pdf 。话不多说,上代码:

import PyPDF2
 
def split_pdf(input_pdf_path, choose_pages):
    with open(input_pdf_path, 'rb') as file:
        reader = PyPDF2.PdfReader(file)
        output_pdf_path = f"new.pdf"
        writer = PyPDF2.PdfWriter()
        for page_number in choose_pages:
            writer.add_page(reader.pages[page_number - 1])
            with open(output_pdf_path, 'wb') as output_file:
                writer.write(output_file)
 
# 使用示例
input_pdf_path = 'example.pdf'  # 输入的PDF文件路径
choose_pages = [3, 6, 9]
split_pdf(input_pdf_path, choose_pages)

如果你还没有安装 PyPDF2,请安装

pip install PyPDF2


http://www.kler.cn/a/516486.html

相关文章:

  • 【2024年华为OD机试】 (C卷,100分)- 用户调度问题(JavaScriptJava PythonC/C++)
  • 图形化数据报文转换映射工具
  • leetcode_链表 21.合并两个有序链表
  • 编程界“华山论剑”:PHP与Go,谁主沉浮?
  • 【LeetCode】--- MySQL刷题集合
  • springboot 配置redis
  • 【C】链表算法题4 -- 合并两个有序链表
  • Spring MVC:深入理解与春招面试要点
  • Jenkins邮件通知的详细配置含邮件通知模板!
  • MyBatis-Plus的插件
  • 如何查找pom文件未使用的依赖
  • 窥探QCC518x-308x系列与手机之间的蓝牙HCI记录与分析 - 耳机篇
  • RabbitMQ2-简单案例
  • JVM深入学习(一)
  • 尚硅谷大数据数仓项目superset db upgrade报错解决(2025.1.23解决)
  • 云原生时代,如何构建高效分布式监控系统
  • OSCP - Proving Grounds - Quackerjack
  • C语言小任务——寻找水仙花数
  • springboot基于微信小程序的商城系统
  • CPU中断机制
  • Ubuntu 24.04 LTS 通过 docker desktop 安装 seafile 搭建个人网盘
  • 分词器的词表大小以及如果分词器的词表比模型的词表大,那么模型的嵌入矩阵需要被调整以适应新的词表大小。
  • MySQL命令及用法(精华版)
  • 接口 V2 完善:基于责任链模式、Canal 监听 Binlog 实现数据库、缓存的库存最终一致性
  • 2024 行远自迩,笃行不怠
  • Geek Uninstaller,绿色免安装轻量的应用卸载工具!