当前位置: 首页 > article >正文

本地部署whisper模型(语音转文字)

Whisper是 OpenAI 2022年发布的一款语音预训练大模型,集成了多语种ASR、语音翻译、语种识别的功能。
Whisper使用弱监督训练的方法,可以直接进行多任务的学习

1. 安装ffmpeg

1.1 更新yum

yum update

1.2 安装gcc

yum install gcc

1.3 在线安装ffmpeg

1.3.1 Install the EPEL repository
yum install epel-release
1.3.2 install ffmpeg
yum install ffmpeg

1.4 离线安装ffmpeg

1.4.1 安装yasm
# 下载
wget -c http://www.tortall.net/projects/yasm/releases/yasm-1.3.0.tar.gz

# 解压
tar -zxvf yasm-1.3.0.tar.gz

# 切换目录
cd yasm-1.3.0

# 执行配置
./configure

# 编译并安装
make && make install
1.4.2 安装FFmpeg
# 下载源码 
git clone https://git.ffmpeg.org/ffmpeg.git ffmpeg 

http://www.kler.cn/a/227449.html

相关文章:

  • 机器学习算法之决策树(DT)
  • 物流平台架构设计与实践
  • 爬虫学习笔记-scrapy安装及第一个项目创建问题及解决措施
  • Leetcode92:反转链表II(区间反转链表)
  • Facebook的社交影响力:用户行为解析与趋势
  • OJ刷题:《剑指offer》之单身狗1、2 !(巧用位操作符,超详细讲解!)
  • 深入Spring MVC的工作流程
  • 如何彻底卸载MySQL【可以解决问题】
  • idea创建spring项目
  • 适合大学英语搜题的软件?如何选择一款好用的大学搜题工具? #职场发展#微信#学习方法
  • 服务器使用过程中遇到常见故障及解决方案(包括蓝屏死机、无法删除的文件如何清理、网络卡、服务器连接不上等)
  • 算法逆向分析之-RC4
  • 4.0 HDFS 配置与使用
  • unity3d的海盗王白银城演示
  • MySQL十部曲之七:InnoDB索引及其优化措施
  • HubSpot营销自动化如何优化营销流程?
  • YoloV8改进策略:Block改进|DCNv4最新实践|高效涨点|完整论文翻译
  • 鸿蒙Native项目生产动态库(.so) 和静态库(.a)
  • C++拷贝构造函数、赋值运算符重载
  • 科普类(遥操作)——快速索引