当前位置: 首页 > article >正文

2024.11.03 周报

一 实时超分音频同步问题:

处理方向:

  1. 按照胡学长的办法尝试: 前面处理视频, 将视频中音频提取出来, 将音频每隔 1-2 秒保存为一段 (这样将音频缓存在内存中) , 然后依次播放, 但是音频是44.1KHz采样率,每秒44100次的频率. 每次间隔中程序处理的极短时间也会出现不可在这里插入代码片避免的卡顿现象(人耳可以感觉到极短时间的声音卡顿). 底层全部实现的话,确实是需要一定时间.
  2. 查看ffmpeg 和 ffplay文档
    ffplay -i .\1_output_audio.aac -af "adelay=2000|2000" 使用 -af 参数, 应用音频滤镜,达到延迟效果。
    ffmpeg -i .\1.mp4 -itsoffset 2 -i .\1_output_audio.aac -map 0:v -map 1:a -c:v copy -c:a aac output.mp4 使用-itsoffset 2 参数设置输入时间戳的偏移量, 将输入音频流的时间戳延迟 2 秒。
    ffmpeg 解转码延迟, ffplay播放延迟均是一种可行性方案.

实际效果:

1. 离线视频:

实现一段离线360P视频实时超分+音视频同步,可以在康佳进行演示。

2. 视频流:

视频流中音频延迟稳定播放已经解决。我使用摄像头的视频流模拟实际电视视频流, 实现了音频的5秒延迟(可设置延迟时间),详细说明可见以下博文:

https://blog.csdn.net/SZ170110231/article/details/143449223?fromshare=blogdetail&sharetype=blogdetail&sharerId=143449223&sharerefer=PC&sharesource=SZ170110231&sharefrom=from_link

二 环境部署:

  1. 康佳PC机:部署超分环境,conda,python,torch, ffmpeg等。
  2. RK3588重装系统,从零开始部署了全套环境。

下周计划

  1. 板端整套的代码实现,整个演示系统。
  2. 模型推理优化加速。

http://www.kler.cn/a/382189.html

相关文章:

  • NavMeshAgent直接transform.position移动报错
  • Android 蓝牙Bluedroid线程池设计思路介绍
  • Qt Quick:CheckBox 复选框
  • Oracle:数据库的顶尖认证
  • 【机器人】机械臂位置、轨迹和转矩控制概要
  • 【ETCD】【源码阅读】深入分析 storeTxnWrite.Put方法源码
  • 初识arkTS
  • 记一次微信云托管搭建Redis服务
  • 【51单片机】串口通信原理 + 使用
  • 动态规划理论基础和习题【力扣】【算法学习day.23】
  • 使用 RabbitMQ 有什么好处?
  • 【大数据学习 | kafka高级部分】文件清除原理
  • 无线振动传感器的安装方法
  • text-embedding-ada-002;BGE模型;M3E模型是Moka Massive Mixed Embedding;BERT
  • react中ref使用支持父调用子组件的方法
  • 基于springboot的音乐网站的设计与实现(源码+lw+调试)
  • 「C/C++」C++标准库 之 #include<iostream> 标准输入输出
  • 酒店管理系统|基于java和小程序的酒店管理小程序系统设计与实现(源码+数据库+文档)
  • 带轴承电枢的一般设计规则
  • MySQL表设计(三大范式 表的设计)
  • 助力你了解人工智能应用场景,分析市场,提高自身竞争力
  • 链表:LRU缓存
  • 算子级血缘助企业数据管理“自动化、精细化、智能化”
  • 自动化研磨领域的革新者:半自动与自动自磨机的技术突破
  • 八大排序总结
  • Spark on YARN:Spark集群模式之Yarn模式的原理、搭建与实践