当前位置: 首页 > article >正文

音视频入门基础:FLV专题(23)——FFmpeg源码中,获取FLV文件音频信息的实现(下)

=================================================================

音视频入门基础:FLV专题系列文章:

音视频入门基础:FLV专题(1)——FLV官方文档下载

音视频入门基础:FLV专题(2)——使用FFmpeg命令生成flv文件

音视频入门基础:FLV专题(3)——FLV header简介

音视频入门基础:FLV专题(4)——使用flvAnalyser工具分析FLV文件

音视频入门基础:FLV专题(5)——FFmpeg源码中,判断某文件是否为FLV文件的实现

音视频入门基础:FLV专题(6)——FFmpeg源码中,解码FLV header的实现

音视频入门基础:FLV专题(7)——Tag header简介

音视频入门基础:FLV专题(8)——FFmpeg源码中,解码Tag header的实现

音视频入门基础:FLV专题(9)——Script Tag简介

音视频入门基础:FLV专题(10)——Script Tag实例分析

音视频入门基础:FLV专题(11)——FFmpeg源码中,解析SCRIPTDATASTRING类型的ScriptDataValue的实现

音视频入门基础:FLV专题(12)——FFmpeg源码中,解析DOUBLE类型的ScriptDataValue的实现

音视频入门基础:FLV专题(13)——FFmpeg源码中,解析任意Type值的SCRIPTDATAVALUE类型的实现

音视频入门基础:FLV专题(14)——FFmpeg源码中,解码Script Tag的实现

音视频入门基础:FLV专题(15)——Video Tag简介

音视频入门基础:FLV专题(16)——FFmpeg源码中,解码Video Tag的VideoTagHeader的实现

音视频入门基础:FLV专题(17)——FFmpeg源码中,提取Video Tag的VIDEODATA的实现

音视频入门基础:FLV专题(18)——Audio Tag简介

音视频入门基础:FLV专题(19)——FFmpeg源码中,解码Audio Tag的AudioTagHeader,并提取AUDIODATA的实现

音视频入门基础:FLV专题(20)——FFmpeg源码中,获取FLV文件major_brand、minor_version、compatible_brands、encoder、Duration的实现

音视频入门基础:FLV专题(21)——FFmpeg源码中,获取FLV文件音频信息的实现(上)

音视频入门基础:FLV专题(22)——FFmpeg源码中,获取FLV文件音频信息的实现(中)

音视频入门基础:FLV专题(23)——FFmpeg源码中,获取FLV文件音频信息的实现(下)

音视频入门基础:FLV专题(24)——FFmpeg源码中,获取FLV文件视频信息的实现

音视频入门基础:FLV专题(25)——通过FFprobe显示FLV文件每个packet的信息

=================================================================

本文接着《音视频入门基础:FLV专题(22)——FFmpeg源码中,获取FLV文件音频信息的实现(中)》,继续讲解FFmpeg获取FLV文件的音频信息到底是从哪个地方获取的。本文的一级标题从“七”开始。

七、Bit depth

FLV文件中每个Audio Tag的AudioTagHeader的SoundSize属性都包含Bit depth(又叫位深度、位元深度、采样深度、采样位数、采样格式)信息。但是如果FLV文件中的音频压缩编码格式为AAC,FFmpeg会强制把Bit depth设置为fltp。这是因为对于有损压缩编解码器(如MP3和AAC),Bit depth是在编码期间计算的,并且可以因采样而异,Bit depth只对PCM数字信号有意义。具体可以参考:《音视频入门基础:AAC专题(3)——AAC的ADTS格式简介》。

可以看到在aac_decode_init函数中(该函数定义在libavcodec/aacdec_template.c),强制把音频采样格式设置成了AV_SAMPLE_FMT_FLTP:

static av_cold int aac_decode_init(AVCodecContext *avctx)
{
//...
    avctx->sample_fmt = AV_SAMPLE_FMT_FLTP;
//...
}

所以如果FLV文件中的音频压缩编码格式为AAC,通过“ffmpeg -i video1.flv命令”获取到的音频采样格式固定为fltp,该值没有意义:

八、音频码率

FFmpeg获取音频码率是通过解析名称为“onMetadata”的Script Tag获取的。onMetadata中存在一个audiodatarate属性表示音频码率,单位为kilobits per second,即Kbps:

由《音视频入门基础:FLV专题(13)——FFmpeg源码中,解析任意Type值的SCRIPTDATAVALUE类型的实现》、《音视频入门基础:FLV专题(14)——FFmpeg源码中,解码Script Tag的实现》可以知道,FFmpeg源码通过amf_parse_object函数中的下面代码块将名称为“onMetadata”的Script Tag中audiodatarate属性解析出来,乘以1024,得到单位为bps的音频码率,存到flv->audio_bit_rate中,即存到(FLVContext *)(s->priv_data)->audio_bit_rate中:

static int amf_parse_object(AVFormatContext *s, AVStream *astream,
                            AVStream *vstream, const char *key,
                            int64_t max_pos, int depth)
{
//...
    if (key) {
    //...
        if (depth == 1) {
            if (amf_type == AMF_DATA_TYPE_NUMBER ||
                amf_type == AMF_DATA_TYPE_BOOL) {
                //...
                else if (!strcmp(key, "audiodatarate") &&
                         0 <= (int)(num_val * 1024.0))
                    flv->audio_bit_rate = num_val * 1024.0;
                //...
                }
        //...
        }
    }
}

然后通过libavformat/flvdec.c中的create_stream函数,将flv->audio_bit_rate赋值给AVCodecParameters的bit_rate。st->codecpar为指向一个AVCodecParameters类型变量的指针:

static AVStream *create_stream(AVFormatContext *s, int codec_type)
{
//...
    if (codec_type == AVMEDIA_TYPE_AUDIO) {
        st->codecpar->bit_rate = flv->audio_bit_rate;
        flv->missing_streams &= ~FLV_HEADER_FLAG_HASAUDIO;
    }
//...
}

通过avcodec_parameters_to_context函数将AVCodecParameters的bit_rate赋值给AVCodecContext的bit_rate:

int avcodec_parameters_to_context(AVCodecContext *codec,
                                  const AVCodecParameters *par)
{
//...
    codec->bit_rate              = par->bit_rate;
//...
}

然后在dump_stream_format函数中,通过avcodec_string函数中的语句:bitrate = get_bit_rate(enc)拿到AVCodecContext的bit_rate,该bit_rate以bps为单位。最后再把它除以1000,得到以kb/s为单位的音频码率,打印出来:

void avcodec_string(char *buf, int buf_size, AVCodecContext *enc, int encode)
{
//...
    bitrate = get_bit_rate(enc);
    if (bitrate != 0) {
        av_bprintf(&bprint, ", %"PRId64" kb/s", bitrate / 1000);
//...
}

所以通过flvAnalyser工具查看到的音频码率跟使用FFmpeg命令查看到的音频码率不一样,这是因为FFmpeg源码中获取onMetadata中的audiodatarate属性是先把它乘以1024,但是打印的时候再除以1000的(正常情况下打印的时候应该除以1024才对)。比如实际的音频码率为133.6865kb/s,乘以1024就是136895b/s,再除以1000就变成了136kb/s。所以FFmpeg(截止FFmpeg7.0.1)打印音频码率这部分代码应该是有bug的,导致显示的音频码率不准确:


http://www.kler.cn/a/385690.html

相关文章:

  • [SWPUCTF 2022 新生赛]Power! 反序列化详细题解
  • 大数据技术之Hadoop :我是恁爹
  • 机器视觉和计算机视觉的区别
  • Linux下useradd 和 adduser的区别
  • MIT 6.S081 Lab1: Xv6 and Unix utilities翻译
  • 信息网络安全——AES加密算法
  • MySQL 和 PostgreSQL 常见区别和联系
  • 信息收集(CISP-PTE笔记)
  • qt5将程序打包并使用
  • 区间数位和
  • 抗辐照MCU芯片工艺解析:如何保障芯片的可靠性
  • 用户登录密码存储加密策略(附Python 和 bcrypt 库进行安全密码验证)
  • 【NLP】使用 SpaCy 通过 LLM 合成数据微调 NER 模型
  • 大数据新视界 -- 大数据大厂之 Impala 性能优化:融合机器学习的未来之路(上 (2-2))(11/30)
  • 《应用力学学报》
  • PyTorch nn.Embedding() 嵌入层详解和要点提醒
  • CSS3中的3D变换(3D空间与景深、透视点的位置、3D位移、3D旋转、3D缩放、3D多重交换、背部可见性)
  • 移动取证和 Android 安全
  • TCP(传输控制协议)和UDP(用户数据报协议)
  • uniapp 小程序 周选择器
  • 【机器学习】平均绝对误差(MAE:Mean Absolute Error)
  • stm32cubeide 1.16.1 在ubuntu 24.04上的安装
  • Intern大模型训练营(五):书生大模型全链路开源体系笔记
  • Python代码主要实现了一个基于Transformer和LSTM的混合模型,用于对给定数据集进行二分类任务
  • 用 Python 从零开始创建神经网络(一)
  • MeterSphere接口自动化-ForEach循环