当前位置：首页 > article >正文

播放器系列4——PCM重采样

article 2025/3/6 20:26:05

FFmpeg重采样过程

swr_alloc_set_opts

struct SwrContext *swr_alloc_set_opts(struct SwrContext *s,
                                      int64_t out_ch_layout, enum AVSampleFormat out_sample_fmt, int out_sample_rate,
                                      int64_t  in_ch_layout, enum AVSampleFormat  in_sample_fmt, int  in_sample_rate,
                                      int log_offset, void *log_ctx);

功能: 分配并设置重采样上下文
参数:
- s: 现有SwrContext指针，可为NULL
- out_ch_layout: 输出声道布局
- out_sample_fmt: 输出采样格式
- out_sample_rate: 输出采样率
- in_ch_layout: 输入声道布局
- in_sample_fmt: 输入采样格式
- in_sample_rate: 输入采样率
- log_offset: 日志偏移量
- log_ctx: 日志上下文
返回值: 成功返回SwrContext指针，失败返回NULL

swr_init

int swr_init(struct SwrContext *s);

功能: 初始化重采样上下文
参数:
- s: SwrContext指针
返回值: 成功返回0，失败返回负值错误码

swr_convert

int swr_convert(struct SwrContext *s, uint8_t **out, int out_count,
                                const uint8_t **in , int in_count);

功能: 执行重采样
参数:
- s: SwrContext指针
- out: 输出缓冲区
- out_count: 输出采样数
- in: 输入缓冲区
- in_count: 输入采样数
返回值: 成功返回输出采样数，失败返回负值错误码

swr_free

void swr_free(struct SwrContext **s);

功能: 释放重采样上下文
参数:
- s: 指向SwrContext指针的指针
返回值: 无

重采样介绍

在本项目中使用ffmpeg对pcm数据进行重采样，使其输出格式满足SDL的要求。
重采样主要改变了三部分内容

采样率
采样格式
声道数

1.重采样的目的

1.匹配设备的采样率

在日常开发中会发现，采购的不同品牌的声卡可能支持的sample_rate不同，比如常见的有44100Hz、48000Hz等。这时候如果将不匹配的pcm数据输入到声卡中，会出现无声或者杂音的情况。因此需要在输入到声卡之前对pcm数据进行重采样，使其采样率与声卡支持的采样率一致。

2.优化存储和传输效率

降低采样率可以减少音频文件的大小，从而节省存储空间和带宽资源。例如，将高采样率（如48kHz）的音频降采样到更低的采样率（如16kHz），虽然会损失一定的音质，但显著减少了文件大小。
我们开发的电视扬声器只有左右声道，那么我们可以将解析出来的pcm数据重采样为2声道，然后在通过音效节点处理，这样可以减少计算量，提高效率。

3.解决混音需求

在K歌软件中，话筒采集到的声音需要与伴奏混合然后通过输出设备输出，假如话筒采集到的pcm数据采样率为48000Hz，而扬声器播放的音频采样率为44100Hz，这时候就需要对麦克风采集到的pcm数据进行重采样，使其采样率与扬声器播放的音频采样率一致，这样才能做之后的MIX处理。
有时候会有多个APP同时从扬声器播放出声音，如果每个app设置的sample_rate不同，那么也会出现无法mix的情况。因此也需要有模块对每个app的音轨resample成相同的sample_rate,然后再进行mix处理。