当前位置：首页 > article >正文

AudioNotes -将音频内容转 markdown

article 2025/3/10 20:33:31

文章目录

- 一、关于 AudioNotes
- - 效果展示
  - - 音视频识别和整理
    - 与音视频内容对话
- 二、使用方法
- - 1、安装 Ollama
  - 2、拉取模型
  - 3、部署服务
  - - 3.1 Docker部署（推荐）🐳
    - 3.2 本地部署 📦

一、关于 AudioNotes

AudioNotes 能够快速提取音视频的内容，并且调用大模型进行整理，成为一份结构化的markdown笔记，方便快速阅读。基于 FunASR 和 Qwen2 构建。

github ： https://github.com/harry0703/AudioNotes
FunASR : https://github.com/modelscope/FunASR
Qwen2: https://ollama.com/library/qwen2

效果展示

音视频识别和整理

在这里插入图片描述

与音视频内容对话

在这里插入图片描述

二、使用方法

1、安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download

2、拉取模型

我以 阿里的千问2 7b 为例 https://ollama.com/library/qwen2

ollama pull qwen2:7b

3、部署服务

有两种部署方式，一种是使用 Docker 部署，另一种是本地部署

3.1 Docker部署（推荐）🐳

curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up

docker 启动后，访问 http://localhost:15433/

登录账号为 admin，密码为 admin （可以在 docker-compose.yml 文件里面修改）

3.2 本地部署 📦

需要有可访问的 postgresql 数据库

conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

将 .env.example 重命名为 .env，修改相关配置信息

chainlit run main.py

服务启动后，访问 http://localhost:8000/

登录账号为 admin，密码为 admin （可以在 .env 文件里面修改）

2024-08-24（六）

查看全文

http://www.kler.cn/a/280120.html

优惠券秒杀项目

行为识别实战第二天——Yolov5+SlowFast+deepsort: Action Detection（PytorchVideo）

三、Buffer Pool详解

CMake构建学习笔记8-OpenSceneGraph库的构建

基于SSM+小程序的垃圾分类管理系统（垃圾2）（源码+sql脚本+视频导入教程+文档）

【2025校招】4399 NLP算法工程师笔试题

【设计模式】模板方法模式和迭代器模式

SpringBoot常见注解

NV GPU FMA指令测试

PMP备考经验 | 如何做到一次考过3A？

Chrome H265 WebRTC 支持

minikube kubevirt 部署实践

python dash框架油气田可视化软件设计文档

一个很好用的idea插件RestfulTookit-fix

嵌入式开发实训室解决方案

【前端基础篇】CSS基础速通万字介绍（上篇）

Excel中让第一行始终显示

在.NET开发中使用 Excel 的最佳方式之一：MiniExcel

java篇常用工具类 0x01：Collection集合

19.VUE2学习篇-mixin