当前位置: 首页 > article >正文

FFmpegFrameRecorder 切分视频文件时结束条件设置不当导致切分后的文件过短问题

问题

下游反馈使用 ffmpeg 切割后的音频文件,无法正确识别其声音的性别

排查流程

1,由于线上大部分用户上传音频后,进行切分后的音频都没问题,因此考虑到这些无法识别性别的音频,有格式问题,需要找出其共性,因此查日志导出所有的错误音频

2,发现这些音频格式都是 mp4(mp4 其实是视频文件但是也包含音频)

3,考虑下游不支持识别 mp4 编码的音频,所以做了一个实验:将完整的音频丢给下游,发现可以正确识别

4,简单看了一下代码了解逻辑,考虑是 ffmpeg 内部切分问题,执行 mp4.ffmpeg -i input.mp4 -ac 1 -ar 16000 output.wav 这条命令,并了解 ffmpeg 在内部会做什么。可能是因为内部切分消息不当导致报错的

5,了解采样率、声道、通道数、样本格式为16位,显式设置音频编码器为 MP3。使用 ffmpeg 拆分 mp3 音频,发现没问题。使用 FFmpegFrameRecorder 拆分 mp4 音频,并且导出,发现只截取了前 130 ms 的内容

6,跟代码发现一个 break 逻辑,很可能是这个问题,结果测试发现,视频没结束但是 frame.samples 为 null 了。发现问题根源

                while ((frame = grabber.grabFrame()) != null) {
                	// samples 表示音频帧,有些视频文件的中间音频帧为空
                    if (frame.samples == null) {
                        // 加了这一层判断,处理了问题。这里额外做音频帧的判断
//                        if (frame.image != null) {
//                            continue;
//                        }
                        break;
                    }
                    // 业务逻辑
                    ...
                }

问题总结

视频文件的中间音频帧可能为空导致的问题


http://www.kler.cn/a/410838.html

相关文章:

  • 周志华深度森林deep forest(deep-forest)最新可安装教程,仅需在pycharm中完成,超简单安装教程
  • 分布式kettle调度平台v6.4.0新功能介绍
  • .net 8使用hangfire实现库存同步任务
  • MongoDB相关问题
  • 破解天然气巡检挑战,构建智能运维体系
  • Flutter:SlideTransition位移动画,Interval动画延迟
  • 深度解析 Docker:重塑软件部署格局
  • Element UI 打包探索【1】
  • bridge-multicast-igmpsnooping
  • 第二十八章 TCP 客户端 服务器通信 - JOB命令示例
  • Python和R荧光分光光度法
  • 基于YOLOv8深度学习的农作物番茄成熟度检测系统研究与实现(PyQt5界面+数据集+训练代码)
  • jmeter基础06_(练习)常见的http请求
  • Reactor 模式的理论与实践
  • 即时通讯平台-音视频即时通讯平台就选WorkPlus
  • 虚拟苹果系统MacOS中新建自定义C++Dylib并用C++测试程序测试
  • QT 跨平台实现 SSDP通信 支持多网卡
  • 【ArcGISPro】使用AI提取要素-土地分类(sentinel2)
  • 用树莓派Pico控制8×8 LED点阵屏:深入解析C++核心知识与动态显示实现
  • 深度学习——3种常见的Transformer位置编码【sin/cos、基于频率的二维位置编码(2D Frequency Embeddings)、RoPE】
  • 突破内存限制:Mac Mini M2 服务器化实践指南
  • 提升软件测试报告的质量:Allure2中添加用例失败截图、日志、HTML块和视频的方法
  • 鸿蒙进阶篇-正则
  • 【linux】服务器加装硬盘后如何将其设置为独立硬盘使用
  • Mamba/PyTorch WSL环境配置
  • SQL进阶:如何跳过多个NULL值取第一个非NULL值?