当前位置: 首页 > article >正文

whisper.cpp: PC端测试 -- 电脑端部署音频大模型

whisper.cpp: PC端测试

    • 1.环境需要
    • 2.构建项目
    • 3.PC测试


1.环境需要

以下是经实验验证可行的环境参考,也可尝试其他版本。

(1)PC:Ubuntu 22.04.4

(2)软件环境:如下表所示

工具版本安装
Anaconda2021.05参考:Anaconda3安装及使用
cmake3.26.0conda install -c conda-forge cmake ; conda install -c conda-forge c-compiler ; conda install -c conda-forge cxx-compiler
make4.4.1conda install -c conda-forge make
ndkandroid-ndk-r26c官网下载解压,设置环境变量
adb1.0.41conda install -c conda-forge adb
git2.34.1sudo apt-get update ; sudo apt-get install git
git-lfs3.6.0sudo apt-get install git-lfs

2.构建项目

(1)克隆项目:

git lfs install
git clone https://github.com/ggerganov/whisper.cpp.git
cd whisper.cpp

(2)下载模型:

# 修改脚本./models/download-ggml-model.sh:
#      替换huggingface.co为镜像网站hf-mirror.com(因不能访问外网)
#src="https://huggingface.co/ggerganov/whisper.cpp"
src="https://hf-mirror.com/ggerganov/whisper.cpp"
    #src="https://huggingface.co/akashmjn/tinydiarize-whisper.cpp"
    src="https://hf-mirror.com/akashmjn/tinydiarize-whisper.cpp"

# 下载模型:下载其中一个 Whisper 模型 转换为 ggml 格式。例如:
sh ./models/download-ggml-model.sh base.en

(3)PC构建:

# build the main example
cmake -B build
cmake --build build --config Release

3.PC测试

# transcribe an audio file
./build/bin/main -f samples/jfk.wav

注意,main示例仅使用 16 位 WAV 运行,因此请确保音频是此格式文件,如不是请转换格式。例如:

# mp3转wav
ffmpeg -i input.mp3 -ar 16000 -ac 1 -c:a pcm_s16le output.wav

说明:要进行快速演示,只需运行 make base.en 与以上操作等效。


声明:资源可能存在第三方来源,若有侵权请联系删除!


http://www.kler.cn/a/451942.html

相关文章:

  • Windows脚本命令与Linux Bash脚本命令
  • 机器学习基础 衡量模型性能指标
  • 2024年全球薄膜功率电感器行业总体规模、主要企业国内外市场占有率及排名
  • 回归预测 | MATLAB实现CNN-LSSVM卷积神经网络结合最小二乘支持向量机多输入单输出回归预测
  • 渗透Vulnhub-DC-9靶机
  • log4j2漏洞复现(CVE-2021-44228)
  • 图像处理-Ch6-彩色图像处理
  • 修改输出资源的名称和路径、自动清空上次打包资源
  • 【C 语言】内存节省机制
  • 深入理解.NET内存回收机制
  • 【论文复现】进行不同视角图像的拼接
  • python如何求欧几里得
  • VMware虚拟机中CentOS系统/dev/mapper/centos-home分区扩容指南
  • 稳定的碰一碰发视频、碰一碰矩阵源码技术开发,支持OEM
  • 2024年12月25日Github流行趋势
  • 【卷积神经网络】常用评价指标总结
  • 使用 C# 代码计算数学表达式
  • 代码随想录算法日记day16 | 513.找树左下角的值、112. 路径总和、106.从中序与后序遍历序列构造二叉树
  • xilinx 芯片使用vivado导出pindelay文件——FPGA学习笔记24
  • 【C语言程序设计——选择结构程序设计】预测你的身高(头歌实践教学平台习题)【合集】
  • 《系统动力学模型构建与Vensim仿真》01系统动力学概述与行为模式
  • 基于Spring Boot的高校请假管理系统
  • VS2022 无法使用GitHub账户登录/无法使用copilot 解决方案
  • 设计模式之外观模式:从电脑组装到系统架构的简化之道
  • 软考:系统架构设计师教材笔记(持续更新中)
  • 记录一个SVR学习