当前位置: 首页 > article >正文

MoneyPrinterTurbo - AI自动生成高清短视频

MoneyPrinterTurbo是一款基于AI大模型的开源软件,旨在通过一键操作帮助用户自动生成高清短视频。只需提供一个视频 主题或 **关键词** ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。

主要功能 🎯

  • 完整的 **MVC架构**,代码 **结构清晰**,易于维护,支持 API​ 和 Web界面​
  • 支持视频文案 **AI自动生成**,也可以**自定义文案**
  • 支持多种 **高清视频** 尺寸:竖屏 9:16,1080x1920​,横屏 16:9,1920x1080​
  • 支持 **批量视频生成**,可以一次生成多个视频,然后选择一个最满意的
  • 支持 **视频片段时长** 设置,方便调节素材切换频率
  • 支持 **中文** 和 **英文** 视频文案
  • 支持 **多种语音** 合成,可 **实时试听** 效果
  • 支持 **字幕生成**,可以调整 字体​、位置​、颜色​、大小​,同时支持字幕描边​设置
  • 支持 **背景音乐**,随机或者指定音乐文件,可设置背景音乐音量​
  • 视频素材来源 **高清**,而且 **无版权**,也可以使用自己的 **本地素材**
  • 支持 **OpenAI**、**Moonshot**、**Azure**、**gpt4free**、**one-api**、**通义千问**、**Google Gemini**、**Ollama**、 **DeepSeek**、 **文心一言** 等多种模型接入

安装使用

配置要求 📦
  • 建议最低 CPU 4核或以上,内存 8G 或以上,显卡非必须
  • Windows 10 或 MacOS 11.0 以上系统
快速开始 🚀

下载一键启动包,解压直接使用(路径不要有 **中文**、**特殊字符**、**空格**)

Windows
  • 百度网盘(1.2.1 最新版本): 百度网盘 请输入提取码 提取码: g36q

下载后,建议先**双击执行** update.bat​ 更新到**最新代码**,然后双击 start.bat​ 启动

启动后,会自动打开浏览器(如果打开是空白,建议换成 **Chrome** 或者 **Edge** 打开)

其他系统

还没有制作一键启动包,看下面的 **安装部署** 部分,建议使用 **docker** 部署,更加方便。

安装部署 📥
前提条件
  • 尽量不要使用 **中文路径**,避免出现一些无法预料的问题
  • 请确保你的 **网络** 是正常的,VPN需要打开全局流量​模式
① 克隆代码
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
② 修改配置文件
  • 将 config.example.toml​ 文件复制一份,命名为 config.toml​
  • 按照 config.toml​ 文件中的说明,配置好 pexels_api_keys​ 和 llm_provider​,并根据 llm_provider 对应的服务商,配置相关的 API Key
Docker部署 🐳
① 启动Docker

如果未安装 Docker,请先安装 Docker Desktop: The #1 Containerization Tool for Developers | Docker

如果是Windows系统,请参考微软的文档:

  1. 安装 WSL | Microsoft Learn
  2. WSL 上的 Docker 容器入门 | Microsoft Learn
cd MoneyPrinterTurbo
docker-compose up
② 访问Web界面

打开浏览器,访问 http://0.0.0.0:8501

③ 访问API文档

打开浏览器,访问 http://0.0.0.0:8080/docs 或者 http://0.0.0.0:8080/redoc

手动部署 📦

视频教程

  • 完整的使用演示:https://v.douyin.com/iFhnwsKY/
  • 如何在Windows上部署:https://v.douyin.com/iFyjoW3M
① 创建虚拟环境

建议使用 conda 创建 python 虚拟环境

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
② 安装好 ImageMagick
  • Windows:

    • 下载 ImageMagick – Download 选择Windows版本,切记一定要选择 **静态库** 版本,比如 ImageMagick-7.1.1-32-Q16-x64-**static**.exe
    • 安装下载好的 ImageMagick,**注意不要修改安装路径**
    • 修改 配置文件 config.toml​ 中的 imagemagick_path​ 为你的 **实际安装路径**
  • MacOS:

    brew install imagemagick
    
  • Ubuntu

    sudo apt-get install imagemagick
    
  • CentOS

    sudo yum install ImageMagick
    
③ 启动Web界面 🌐

注意需要到 MoneyPrinterTurbo 项目 根目录​ 下执行以下命令

Windows

conda activate MoneyPrinterTurbo
webui.bat

MacOS or Linux

conda activate MoneyPrinterTurbo
sh webui.sh

启动后,会自动打开浏览器(如果打开是空白,建议换成 **Chrome** 或者 **Edge** 打开)

④ 启动API服务 🚀
python main.py

启动后,可以查看 API文档​ http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接在线调试接口,快速体验。

语音合成 🗣

所有支持的声音列表,可以查看:声音列表

2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。

字幕生成 📜

当前支持2种字幕生成方式:

  • **edge**: 生成速度快​,性能更好,对电脑配置没有要求,但是质量可能不稳定
  • **whisper**: 生成速度慢​,性能较差,对电脑配置有一定要求,但是质量更可靠​。

可以修改 config.toml​ 配置文件中的 subtitle_provider​ 进行切换

建议使用 edge​ 模式,如果生成的字幕质量不好,再切换到 whisper​ 模式

注意:

  1. whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅
  2. 如果留空,表示不生成字幕。

由于国内无法访问 HuggingFace,可以使用以下方法下载 whisper-large-v3​ 的模型文件

下载地址:

  • 百度网盘: 百度网盘 请输入提取码
  • 夸克网盘:夸克网盘分享

模型下载后解压,整个目录放到 .\MoneyPrinterTurbo\models​ 里面, 最终的文件路径应该是这样: .\MoneyPrinterTurbo\models\whisper-large-v3​

MoneyPrinterTurbo  
  ├─models
  │   └─whisper-large-v3
  │          config.json
  │          model.bin
  │          preprocessor_config.json
  │          tokenizer.json
  │          vocabulary.json
背景音乐 🎵

用于视频的背景音乐,位于项目的 resource/songs​ 目录下。

当前项目里面放了一些默认的音乐,来自于 YouTube 视频,如有侵权,请删除。

字幕字体 🅰

用于视频字幕的渲染,位于项目的 resource/fonts​ 目录下,你也可以放进去自己的字体。


http://www.kler.cn/a/399108.html

相关文章:

  • 层归一化和批归一化
  • vueRouter路由切换时实现页面子元素动画效果, 左右两侧滑入滑出效果
  • 使用Web Animations API实现复杂的网页动画效果
  • 计算机组成与原理(2) basic of computer architecture
  • 【操作系统实验课】Makefile与编译
  • 从零开始学习 sg200x 多核开发之 uboot saveenv 功能使能
  • 学习大数据DAY62 指标计算
  • mybatisPlus打印sql配置
  • Java面试之多线程并发篇(3)
  • 【51单片机】LCD1602液晶显示屏
  • Spring Boot 应用程序中集成 Redis 并实现存储读取字符串或者复杂对象
  • 【MySQL】MySQL的笛卡尔积现象是什么?简单说说
  • Django数据写入MySQL数据库
  • 蓝牙 HFP 协议详解及 Android 实现
  • 用 Python 从零开始创建神经网络(八):梯度、偏导数和链式法则
  • Elasticsearch基本概念及使用
  • css:修改盒子样式
  • vue3 查看word pdf excel文件
  • 【论文阅读】(Security) Assertions by Large Language Models
  • # JAVA中的Stream学习
  • STM32设计防丢防摔智能行李箱
  • 计算机毕业设计 | springboot+vue大学城水电管理系统 校园学校物业水电管理(附源码+文档)
  • Spring:IoC/DI加载properties文件
  • opencv kdtree pcl kdtree 效率对比
  • Linux中开启 Vim 之旅:从快捷键到插件的实用手册
  • Android【01】TRTC实现跨应用屏幕录制