当前位置: 首页 > article >正文

C# 将PDF文档转换为Markdown文档

将PDF文件转换为Markdown格式是一个非常实用的需求,尤其是在需要将内容从固定布局的PDF文件中提取出来,并转换为更易于编辑和处理的文本格式时。本文将介绍如何通过C#代码将PDF文档转换Markdown(MD)文档

需要用到第三方库 Spire.PDF for .NET
可以从以下链接下载产品包后手动添加引用,或者直接通过NuGet安装。
https://www.e-iceblue.cn/Downloads/Spire-PDF-NET.html

C# 将PDF转为Markdown文档

步骤:

  1. 创建 PdfDocument 类的对象
  2. 通过 LoadFromFile() 方法加载PDF文档;
  3. 通过 SaveToFile(string filename, FileFormat.Markdown) 将加载的PDF文档转换为markdown文档。

示例代码:

using Spire.Pdf;

namespace PDFToMarkdown
{
    class Program
    {
        static void Main(string[] args)
        {
            //加载PDF文档
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("测试.pdf");

            //将PDF转换为MD文档
            pdf.SaveToFile("PDF转Markdown.md", FileFormat.Markdown);
            pdf.Close();
        }
    }
}

PDF转MD文档


  • 该Spire.PDF for .NET库支持多种在.NET 程序创建、读取、转换、打印PDF文档的操作,更多示例可以参考:
    https://www.e-iceblue.cn/spirepdfnet/spire-pdf-for-net-program-guide-content.html

  • 对于生成文档中的水印,点击申请临时授权移除并完整试用:
    https://www.e-iceblue.cn/misc/temporary-license.html


http://www.kler.cn/news/354788.html

相关文章:

  • Go语言Gin框架调用企业微信接口根据手机号获取userid
  • 滚雪球学Redis[7.3讲]:Redis在排行榜系统中的应用:高效构建与优化
  • 【C++刷题】力扣-#136-只出现一次的数字
  • FPGA基于SRIO Auraro 三速以太网 IIC SPI等多协议的高速传输处理项目
  • AOT漫谈专题(第三篇): 如何获取C#程序的CPU利用率
  • 前端常用算法和数据结构
  • 推动实验室数字化,LIMS主要功能及优势
  • k8s中的微服务
  • 【C语言】递归函数变量的作用域
  • Elasticsearch(二)集成Spring Boot 基本的API操作
  • oracle实例宕机,虚拟机磁盘精简配置模式,磁盘无法扩展
  • C++ 内存管理 对比C语言动态内存管理;operator new和delete
  • 洛谷 P1803:凌乱的yyy / 线段覆盖 ← 贪心算法
  • (C/C++)文件
  • 鼠标市场洞察:数据分析揭示消费趋势!
  • 如何解决MQ的重复消费问题?Kafka、ActiveMQ、RabbitMQ有什么区别?
  • 低功耗 ARMxy工业计算机:工业场景的绿色新选择
  • Linux 简述基于 TCP 连接状态分析网络排障
  • 【C语言】函数的声明与定义
  • Windows 和 Ubuntu通讯的网络设置