【硬核HeyGen平替】在window平台上使用MyHeyGen
最近在研究HeyGen的平替开源项目,然后发现了MyHeyGen这个项目,但是文档上面并没有说明如果在window平台上使用,考虑到非window平台安装显卡驱动什么的比较繁琐,所以尝试硬着头皮干...
前提
开源项目中所需的环境准备要先准备好
1.拉取项目
git clone https://github.com/AIFSH/MyHeyGen.git
调整安装脚本 install.sh,注释掉底下的 apt 安装,这里主要是要安装 ffmpeg,这个稍后需要在window平台上安装。
pip install ninja==1.10.2.3
pip install dlib --verbose
# pip install librosa==0.9.2
#apt update
#apt install ffmpeg
然后就可以通过pip安装所需要的组件库了
2.安装 pip 组件库
这里碰到的第一个问题就是window的命令窗口不能够直接执行 sh 脚本,bash 命令window平台并没有,那么我们可以用 Git Bash,这里面执行这个脚本,同时,也能解决 window 平台没有Linux的一些常用命令,如cp、mv和rm等命令。
3.安装 ffmpeg
ffmpeg下载地址
笔者选择的是release-full版本,跟shared版本没太大区别。
解压出来的目录文件,bin目录下只有三个执行文件。
然后配置系统环境变量,就是在系统变量的path里面,添加这个bin目录路径就可以了。
要验证是否配置好了,重新打开一个命令行窗口,输入: ffmpeg -version,有版本信息输出,则证明配置成功。
3.安装 Microsoft C++ 库
在安装TTS的时候,可能会提示错误 "ERROR: Could not build wheels for tts, which is required to install pyproject"。
下载Microsoft C++ 生成工具,并安装。
4.执行转换
作者给的测试命令是基于 Linux 环境的,但是我们是window平台,所以这里就需要解决文件路径的问题。
1)video-retalking目录下的 inference.py
第一个调整点:
这个脚本涉及到转换过程中的文件复制删除、截取文件名等操作,所以要调整为window风格的。
可以打开文本编辑器,全文搜索一下 split 关键词,要将这里的 "/" 改为 "\\",这种情况有多处的,全部都需要修改一下。
调整后
第二个调整点:
不清楚是不是ffmpeg版本的问题,走到这行的时候,会提示 rf 是一个不合法的参数,所以笔者将后面的删除操作去掉了,这里应该是清除一些临时文件。
调整后
5.其他
剩下的就是安装过程中,pip组件库的版本冲突,不兼容,网络超时等情况,这些都好解决...
如有小伙伴们有遇到什么问题,也欢迎一起讨论