当前位置: 首页 > article >正文

Python 复制PDF中的页面

操作PDF文档时,复制其中的指定页面可以帮助我们从PDF文件中提取特定信息,如文本、图表或数据等,以便在其他文档中使用。复制PDF页面也可以实现在不同文件中提取页面,以创建一个新的综合文档。
本文将介绍如何使用Python 在同一文档中复制PDF页面,或者复制页面到另一PDF文档中。

所需Python库 - Spire.PDF for Python。可以通过下面的pip命令直接安装:
pip install Spire.Pdf

Python 在同一PDF 文档中复制页面

Spire.PDF for Python库支持在文档中添加新页面,然后将指定页面的内容绘制到新页面来实现复制PDF页面。操作如下:

  1. 使用 LoadFromFile() 方法加载PDF文档;
  2. 获取文档中指定页面,然后使用 CreateTemplate() 方法基于页面内容创建模板;
  3. 通过 Insert() 方法在指定索引处插入空白新页面 (也可以使用 Add() 方法直接在文档末尾添加新页面);
  4. 使用 PdfPageBase.Canvas.DrawTemplate() 方法将模板绘制到新页面上;
  5. 使用 SaveToFile() 方法保存PDF文档。

Python 代码:

from spire.pdf.common import *
from spire.pdf import *

# 加载PDF文档
pdf = PdfDocument()
pdf.LoadFromFile("实验.pdf")

# 获取第一页
page = pdf.Pages[0]

# 基于该页面创建模板
template = page.CreateTemplate()

# 插入一个新页面到第二位置处
page = pdf.Pages.Insert(1, page.Size, PdfMargins(0.0))

# 将模板绘制到新页面上
page.Canvas.DrawTemplate(template, PointF(0.0, 0.0))

# 保存PDF
pdf.SaveToFile("复制PDF页面.pdf");
pdf.Close()

复制PDF页面

Python在不同PDF 文档之间复制页面

也可以将指定页面从一个PDF文档复制到另一个PDF文档中,具体操作如下:

  1. 使用 LoadFromFile() 方法加载两个PDF文档;
  2. 获取文档1中指定页面,然后使用 CreateTemplate() 方法基于页面内容创建模板;
  3. 通过 Insert() 方法在文档2中指定索引处插入空白新页面;
  4. 使用 PdfPageBase.Canvas.DrawTemplate() 方法将模板绘制到新页面上;
  5. 使用 SaveToFile() 方法保存结果文档

Python 代码:

from spire.pdf.common import *
from spire.pdf import *

# 加载文档1
pdf1 = PdfDocument()
pdf1.LoadFromFile("实验.pdf")

# 加载文档2
pdf2 = PdfDocument()
pdf2.LoadFromFile("南极洲.pdf")

# 获取文档1中的第一页
page = pdf1.Pages[0]

# 基于该页面内容创建模板
template = page.CreateTemplate()

# 在文档2指定位置处插入空白新页面
newPage = pdf2.Pages.Insert(0, page.Size, PdfMargins(0.0))

# 将模板绘制到新页面上
newPage.Canvas.DrawTemplate(template, PointF(0.0, 0.0))

# 保存PDF
pdf2.SaveToFile("复制页面到另一PDF.pdf")
pdf2.Close()

复制PDF页面


生成文档中的红色水印,可以通过点击以下链接,申请一个月免费授权来去除:
https://www.e-iceblue.cn/misc/temporary-license.html


http://www.kler.cn/a/325849.html

相关文章:

  • 【大数据】机器学习-----线性模型
  • 互斥与同步
  • 宝塔面板 申请证书后 仍然提示不安全
  • SpringBoot-Day1
  • 【数据可视化-12】数据分析岗位招聘分析
  • 亿道三防丨三防笔记本是什么意思?和普通笔记本的优势在哪里?
  • 基于Vue3内置的lodash函数库实现防抖节流
  • centos9 nginx 版本
  • 深入解析Excel文件格式:.xls与.xlsx的差异与应用指南
  • 网络战时代的端点安全演变
  • HTML流光爱心
  • 【VUE】axios组件
  • 解决 Pandas 中的 XLRDError:处理 “Excel xlsx file; not supported” 错误
  • 知识产权的力量
  • 四十五、多云/混合云架构设计(多云监控平台与工具介绍)
  • 动态规划算法专题(一):斐波那契数列模型
  • 机器学习课程学习周报十四
  • 常见电脑品牌BIOS设置与进入启动项快捷键
  • 物理学基础精解【23】
  • golang学习笔记27-反射【重要】
  • C++ | Leetcode C++题解之第447题回旋镖的数量
  • 汽车EDI:Martinrea EDI 对接
  • 自动驾驶系统研发系列—智能驾驶守门员:详解DOW(开门预警)功能,开启更安全的驾驶体验
  • 字节C++抖音直播一面-面经总结
  • JAVA线程基础二——锁的概述之乐观锁与悲观锁
  • 【前端】ES12:ES12新特性