当前位置: 首页 > article >正文

AudioNotes -将音频内容转 markdown

文章目录

    • 一、关于 AudioNotes
      • 效果展示
        • 音视频识别和整理
        • 与音视频内容对话
    • 二、使用方法
      • 1、安装 Ollama
      • 2、拉取模型
      • 3、部署服务
        • 3.1 Docker部署(推荐)🐳
        • 3.2 本地部署 📦


一、关于 AudioNotes

AudioNotes 能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读。基于 FunASR 和 Qwen2 构建。

  • github : https://github.com/harry0703/AudioNotes
  • FunASR : https://github.com/modelscope/FunASR
  • Qwen2: https://ollama.com/library/qwen2

效果展示


音视频识别和整理

在这里插入图片描述


与音视频内容对话

在这里插入图片描述


二、使用方法


1、安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download


2、拉取模型

我以 阿里的千问2 7b 为例 https://ollama.com/library/qwen2

ollama pull qwen2:7b

3、部署服务

有两种部署方式,一种是使用 Docker 部署,另一种是本地部署


3.1 Docker部署(推荐)🐳
curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up

docker 启动后,访问 http://localhost:15433/

登录账号为 admin,密码为 admin (可以在 docker-compose.yml 文件里面修改)


3.2 本地部署 📦

需要有可访问的 postgresql 数据库

conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

.env.example 重命名为 .env,修改相关配置信息

chainlit run main.py

服务启动后,访问 http://localhost:8000/

登录账号为 admin,密码为 admin (可以在 .env 文件里面修改)


2024-08-24(六)


http://www.kler.cn/a/280120.html

相关文章:

  • 优惠券秒杀项目
  • 行为识别实战第二天——Yolov5+SlowFast+deepsort: Action Detection(PytorchVideo)
  • 三、Buffer Pool详解
  • CMake构建学习笔记8-OpenSceneGraph库的构建
  • 基于SSM+小程序的垃圾分类管理系统(垃圾2)(源码+sql脚本+视频导入教程+文档)
  • 【2025校招】4399 NLP算法工程师笔试题
  • 【设计模式】模板方法模式和迭代器模式
  • SpringBoot常见注解
  • NV GPU FMA指令测试
  • PMP备考经验 | 如何做到一次考过3A?
  • Chrome H265 WebRTC 支持
  • minikube kubevirt 部署实践
  • python dash框架 油气田可视化软件设计文档
  • 一个很好用的idea插件RestfulTookit-fix
  • 嵌入式开发实训室解决方案
  • 【前端基础篇】CSS基础速通万字介绍(上篇)
  • Excel中让第一行始终显示
  • 在.NET开发中使用 Excel 的最佳方式之一:MiniExcel
  • java篇 常用工具类 0x01:Collection集合
  • 19.VUE2学习篇-mixin