使用开源项目:pdf2docx,让PDF转换为Word
目录
1.安装python
2.安装 pdf2docx
3.使用 pdf2docx 转换 PDF 到 Word
pdf2docx:GitCode - 全球开发者的开源社区,开源代码托管平台
环境:windows电脑
1.安装python
Download Python | Python.org
最好下载3.8以上的版本
安装时记得选择上:Add ... Path
安装时默认会装pip等工具,因此下载安装包时不要选择:embeddable package (64-bit)
2.安装 pdf2docx
命令:pip install pdf2docx --timeout 100
3.使用 pdf2docx 转换 PDF 到 Word
from pdf2docx import Converter
# 输入PDF文件路径
pdf_file = "D:/software/python3.12/code/redis.pdf"
# 输出Word文档路径
docx_file = "D:/software/python3.12/code/redis.docx"
# 创建转换器
cv = Converter(pdf_file)
# 执行转换
cv.convert(docx_file, start=0, end=None)
cv.close()
运行: python .\pdfToword.py
查看转换后的Word文档