当前位置: 首页 > article >正文

PDF2Audio - 阅读 PDF 的新方式

1000 Stars 127 Forks 10 Issues 0 贡献者 Apache-2.0 License Python 语言

代码: GitHub - lamm-mit/PDF2Audio

更多AI开源软件:AI开源 - 小众AI

PDF2Audio,它将彻底改变我们阅读和理解 PDF 文件的方式。我们不再需要盯着屏幕,而是让信息以声音的形式流淌进你的耳朵,无论是在通勤的路上、健身时,还是任何需要解放双手的场合。

PDF2Audio.webp

主要功能

  • 支持处理多个 PDF 文件
  • 支持选择不同的指令模板(播客、讲座、摘要等)
  • 自定义文本生成和音频模型
  • 支持为演讲者选择不同的声音
  • 对文稿的编辑和对模型的具体反馈进行草稿迭代改进

快速使用

  • 克隆仓库
git clone https://github.com/lamm-mit/PDF2Audio.git
cd PDF2Audio
  • 创建 Conda 环境
conda create -n pdf2audio python=3.9
  • 激活已创建的 Conda 环境
conda activate pdf2audio
  • 安装依赖
pip install -r requirements.txt
  • 创建 .env 文件,配置 OpenAI Key
OPENAI_API_KEY=your_api_key_here
  • 运行 app.py 启动应用
python app.py

http://www.kler.cn/a/468930.html

相关文章:

  • 常用LabVIEW算法及应用
  • 论文解读 | NeurIPS'24 IRCAN:通过识别和重新加权上下文感知神经元来减轻大语言模型生成中的知识冲突...
  • .net core修行之路-多线程异步编程概念篇
  • 桌面运维岗面试三十问
  • AlphaPi相关硬件驱动提取
  • SpringMVC(六)拦截器
  • 【工具整理】WIN换MAC机器使用工具整理
  • vue数据请求通用方案:axios的options都有哪些值
  • 《计算机网络A》单选题(详解)
  • 2、蓝牙打印机点灯-GPIO输出控制
  • AdaBoost算法详解与PyTorch实现
  • STM32CUBEMX+PLS_D1000激光测距模块+MT6701角度传感器,获取三角形第三边长度
  • 国内Ubuntu环境Docker部署 SenseVoice
  • Vue动态控制disabled属性
  • 基于单片机的肺功能MVV简单测算
  • Go语言的 的同步与异步编程(Synchronization Asynchronous Programming)基础知识
  • 聊聊 C# 中的委托
  • 数据库系统概论期末复习
  • 资金管理系统——python
  • iOS 逆向学习 - iOS Architecture Core OS Layer
  • pytorch索引操作函数介绍
  • DOM HTML
  • 【Vim Masterclass 笔记05】第 4 章:Vim 的帮助系统与同步练习(L14+L15+L16)
  • 银行账户类别详解
  • 【Springboot知识】Springboot监控工具SpringbootAdmin
  • 游泳溺水识别数据集,对25729张图片进行YOLO,COCO JSON, VOC XML 格式的标注,溺水平均识别率在89.9%