当前位置: 首页 > article >正文

使用开源项目:pdf2docx,让PDF转换为Word

目录

1.安装python

2.安装 pdf2docx

3.使用 pdf2docx 转换 PDF 到 Word


pdf2docx:GitCode - 全球开发者的开源社区,开源代码托管平台

环境:windows电脑

1.安装python

Download Python | Python.org

最好下载3.8以上的版本

安装时记得选择上:Add ... Path

安装时默认会装pip等工具,因此下载安装包时不要选择:embeddable package (64-bit)

2.安装 pdf2docx

命令:pip install pdf2docx --timeout 100

3.使用 pdf2docx 转换 PDF 到 Word

from pdf2docx import Converter

# 输入PDF文件路径
pdf_file = "D:/software/python3.12/code/redis.pdf"

# 输出Word文档路径
docx_file = "D:/software/python3.12/code/redis.docx"

# 创建转换器
cv = Converter(pdf_file)

# 执行转换
cv.convert(docx_file, start=0, end=None)
cv.close()

运行: python .\pdfToword.py

查看转换后的Word文档


http://www.kler.cn/a/532871.html

相关文章:

  • 基于“蘑菇书”的强化学习知识点(五):条件期望
  • 读写锁: ReentrantReadWriteLock
  • 【Redis】安装配置Redis超详细教程 / Linux版
  • DeepSeek-R1:通过强化学习激励大型语言模型(LLMs)的推理能力
  • 【爬虫】JS逆向解决某药的商品价格加密
  • Windows图形界面(GUI)-QT-C/C++ - QT Stacked Widget
  • Activity相关学习(一)
  • 进程及从Linux分析进程
  • 25.02.04 《CLR via C#》 笔记14
  • PyQt4学习笔记2】Qt 的 Model/View 架构
  • c++ 程序计算圆的面积(Program to find area of a circle)
  • Vue3 插槽系统详解
  • PyQt4学习笔记3】QDockWidget
  • 基于多智能体强化学习的医疗AI中RAG系统程序架构优化研究
  • Linux的简单使用和部署4asszaaa0
  • 探索 Copilot:开启智能助手新时代
  • Django框架的全面指南:从入门到高级
  • HarmonyOS_如何字体跟随系统
  • MySQL适合创建索引的11种情况
  • DeepSeek 的含金量还在上升
  • 2025新时代 | 分析并解决企业跨域问题
  • 两种文件类型(pdf/图片)打印A4半张纸方法
  • Windows电脑本地部署运行DeepSeek R1大模型(基于Ollama和Chatbox)
  • 数据结构 栈 C++ 蓝桥杯
  • unordered_map/set的哈希封装
  • 模型蒸馏原理介绍