当前位置: 首页 > article >正文

播放器系列4——PCM重采样

FFmpeg重采样过程

swr_alloc创建重采样上下文
swr_alloc_set_opts设置重采样参数
swr_init初始化重采样器
swr_convert执行重采样
swr_free释放资源
swr_alloc_set_opts
struct SwrContext *swr_alloc_set_opts(struct SwrContext *s,
                                      int64_t out_ch_layout, enum AVSampleFormat out_sample_fmt, int out_sample_rate,
                                      int64_t  in_ch_layout, enum AVSampleFormat  in_sample_fmt, int  in_sample_rate,
                                      int log_offset, void *log_ctx);
  • 功能: 分配并设置重采样上下文
  • 参数:
    • s: 现有SwrContext指针,可为NULL
    • out_ch_layout: 输出声道布局
    • out_sample_fmt: 输出采样格式
    • out_sample_rate: 输出采样率
    • in_ch_layout: 输入声道布局
    • in_sample_fmt: 输入采样格式
    • in_sample_rate: 输入采样率
    • log_offset: 日志偏移量
    • log_ctx: 日志上下文
  • 返回值: 成功返回SwrContext指针,失败返回NULL
swr_init
int swr_init(struct SwrContext *s);
  • 功能: 初始化重采样上下文
  • 参数:
    • s: SwrContext指针
  • 返回值: 成功返回0,失败返回负值错误码
swr_convert
int swr_convert(struct SwrContext *s, uint8_t **out, int out_count,
                                const uint8_t **in , int in_count);
  • 功能: 执行重采样
  • 参数:
    • s: SwrContext指针
    • out: 输出缓冲区
    • out_count: 输出采样数
    • in: 输入缓冲区
    • in_count: 输入采样数
  • 返回值: 成功返回输出采样数,失败返回负值错误码
swr_free
void swr_free(struct SwrContext **s);
  • 功能: 释放重采样上下文
  • 参数:
    • s: 指向SwrContext指针的指针
  • 返回值: 无

重采样介绍

在本项目中使用ffmpeg对pcm数据进行重采样,使其输出格式满足SDL的要求。
重采样主要改变了三部分内容

  • 采样率
  • 采样格式
  • 声道数

1.重采样的目的

1.匹配设备的采样率

在日常开发中会发现,采购的不同品牌的声卡可能支持的sample_rate不同,比如常见的有44100Hz、48000Hz等。这时候如果将不匹配的pcm数据输入到声卡中,会出现无声或者杂音的情况。因此需要在输入到声卡之前对pcm数据进行重采样,使其采样率与声卡支持的采样率一致。

2.优化存储和传输效率

降低采样率可以减少音频文件的大小,从而节省存储空间和带宽资源。例如,将高采样率(如48kHz)的音频降采样到更低的采样率(如16kHz),虽然会损失一定的音质,但显著减少了文件大小。
我们开发的电视扬声器只有左右声道,那么我们可以将解析出来的pcm数据重采样为2声道,然后在通过音效节点处理,这样可以减少计算量,提高效率。

3.解决混音需求

  • 在K歌软件中,话筒采集到的声音需要与伴奏混合然后通过输出设备输出,假如话筒采集到的pcm数据采样率为48000Hz,而扬声器播放的音频采样率为44100Hz,这时候就需要对麦克风采集到的pcm数据进行重采样,使其采样率与扬声器播放的音频采样率一致,这样才能做之后的MIX处理。
  • 有时候会有多个APP同时从扬声器播放出声音,如果每个app设置的sample_rate不同,那么也会出现无法mix的情况。因此也需要有模块对每个app的音轨resample成相同的sample_rate,然后再进行mix处理。

源码地址

https://github.com/OrangeKitten/VideoPlayer


http://www.kler.cn/a/571788.html

相关文章:

  • 【愚公系列】《Python网络爬虫从入门到精通》039-MySQL数据库
  • 学生管理信息系统的需求分析与设计
  • 解决ubuntu文件中文名乱码的问题
  • SpaCy处理NLP的详细工作原理及工作原理框图
  • 【Python】——使用python实现GUI图书管理系统:Tkinter+SQLite实战
  • 【Copilot极限实践日记】DAY 2: 使用Copilot/ChatGPT解决项目编译问题
  • 24、《Spring Boot 的 Actuator 监控深度解析》
  • 任务9:交换机基础及配置
  • Androidstudio使用BottomNavigationView 实现底部导航栏
  • C++类与对象:银行管理系统项目实战开发LeetCode每日一题
  • 系统架构设计师-第3章 数据库设计
  • 【jenkins配置记录】
  • 【在Spring Boot项目中接入Modbus协议】
  • PyTorch系列教程:评估和推理模式下模型预测
  • post get 给后端传参数
  • 爬虫系列之发送请求与响应《一》
  • 通俗版解释:分布式和微服务就像开餐厅
  • sa-token全局过滤器之写法优化(包含设置Order属性)
  • HiRT:利用分层机器人Transformer 增强机器人控制
  • 企业级Python后端数据库使用指南(简略版)