当前位置: 首页 > article >正文

Python利用VideoCapture和FFmpeg读取多个rtsp流性能的比较

最近一个项目,要用python读取30个海康摄像头的rtsp流,一开始直接用cv2.VideoCapture(video_path),结果运行一段时间后发现读出来的frame经常出现花屏的现象。所以通过两种方式对程序进行了修改。

1、我先是通过cap.set(cv2.CAP_PROP_BUFFERSIZE, 3)设置缓冲区大小可能有助于减少丢帧现象。代码如下:

import cv2  # 导入 OpenCV 库,用于处理计算机视觉和视频流相关的功能。

# 设置 RTSP 视频流的路径(用户名、密码、IP 地址和视频流的 URL)。
video_path = 'rtsp://admin:123456@192.168.3.101/Streaming/Channels/1'

# 使用 cv2.VideoCapture 打开 RTSP 视频流,cap 是一个视频捕获对象。
cap = cv2.VideoCapture(video_path)

# 设置视频流缓冲区的大小,减少延迟,CAP_PROP_BUFFERSIZE 设置为 3 表示缓冲区大小为 3 帧。
cap.set(cv2.CAP_PROP_BUFFERSIZE, 3)

# 检查视频流是否成功打开并且继续读取帧。cap.isOpened() 返回 True 表示视频流打开成功。
while cap.isOpened():
    # 读取视频流中的一帧。返回值 success 表示读取是否成功,frame 为读取到的图像帧。
    success, frame = cap.read()

    # 如果成功读取到帧,则显示该帧。
    if success:
        # 使用 OpenCV 显示读取到的视频帧,"SHOW" 为窗口名称,frame 为图像数据。
        cv2.imshow("SHOW", frame)
        
        # 等待 1 毫秒,检测按键。如果按下 'q' 键,则退出循环。
        if cv2.waitKey(1) & 0xFF == ord("q"):
            break  # 按下 'q' 键退出循环,关闭视频流。

2、然后我又尝试用FFmpeg直接处理RTSP流。

首先要安装ffmpeg,执行命令:

pip install ffmpeg-python

python代码如下:

import ffmpeg  # 导入 ffmpeg 库,用于处理视频流(如 RTSP 流)。
import numpy as np  # 导入 NumPy 库,用于处理数据(如视频帧的数组操作)。
import cv2  # 导入 OpenCV 库,用于处理计算机视觉相关的功能(如显示视频)。

# 设置摄像头的 RTSP 流地址(用户名、密码、IP 地址和视频流的 URL)。
camera = 'rtsp://admin:123456@192.168.3.101/Streaming/Channels/1'

# 使用 ffmpeg.probe 函数探测摄像头的视频流信息,返回一个包含流信息的字典。
probe = ffmpeg.probe(camera)

# 从探测结果中找到视频流(选择 codec_type 为 'video' 的流)。
video_stream = next((stream for stream in probe['streams'] if stream['codec_type'] == 'video'), None)

# 获取视频流的宽度和高度,并将其转换为整数类型。
width = int(video_stream['width'])
height = int(video_stream['height'])

# 使用 ffmpeg 创建一个异步运行的命令,将视频流传输到管道中,并指定格式、像素格式、帧率等。
out = (
    ffmpeg
        .input(camera, rtsp_transport='tcp')  # 设置输入源为摄像头 RTSP 流,并指定使用 TCP 协议。
        .output('pipe:', format='rawvideo', pix_fmt='bgr24', loglevel="quiet", r=25)  # 输出到管道,指定原始视频格式,像素格式为 BGR24,帧率为 25 帧每秒。
        .run_async(pipe_stdout=True)  # 异步运行 ffmpeg,并将标准输出连接到管道。
)

# 初始化空帧计数器,检测视频流是否断开。
cnt_empty = 0

# 无限循环,持续读取视频流并处理每一帧。
while True:
    # 从管道读取一帧数据,每帧的大小为 height * width * 3(3 为每个像素的 RGB 通道)。
    in_bytes = out.stdout.read(height * width * 3)

    # 如果没有读取到数据(即视频流结束或出现错误),则增加空帧计数器。
    if not in_bytes:
        cnt_empty += 1
        # 如果连续 10 次没有数据,则认为视频流已结束,跳出循环。
        if cnt_empty > 10:
            break

    # 如果有数据,重置空帧计数器。
    cnt_empty = 0

    # 将读取到的字节数据转换为 NumPy 数组,并重新塑形为图像帧(height, width, 3 表示高、宽、RGB 三通道)。
    frame = np.frombuffer(in_bytes, dtype=np.uint8).reshape(height, width, 3)

    # 使用 OpenCV 显示视频帧(此时 frame 是图像数据)。
    cv2.imshow('test', frame)

    # 等待按键,如果按下 'q' 键则退出循环。
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放资源(在程序退出时关闭 OpenCV 的窗口等资源)。
cv2.destroyAllWindows()

3、结论:
由于时间关系,我没用数据详细比较。直观感觉,只接入一两个摄像头,两种方式没什么区别,但是当摄像头很多并且分辨率和帧率都比较高时,FFmpeg延迟相对更低,性能表现好一些。下面这个表是网上找的,仅供参考。
 

特性cv2.VideoCapture (FFmpeg via OpenCV)FFmpeg (命令行或库调用)
简便性高,简洁的 API,直接使用 cv2.VideoCapture较低,需手动设置 FFmpeg 参数
性能依赖于 FFmpeg,适合一般应用,但可能有延迟通常更高效,低延迟,优化过的解码器
灵活性灵活性较低,只能使用 OpenCV 提供的功能高,可以精细控制流媒体传输、解码等
适用场景普通的视频捕获和播放,实时性要求不高需要低延迟、高性能和灵活控制的场景
库依赖基6于 FFmpeg,但封装在 OpenCV 中直接使用 FFmpeg

效率:FFmpeg 直接处理 RTSP 视频流的效率通常更高,尤其是在高帧率、低延迟的要求下,FFmpeg 的解码性能通常更好。
简便性:如果你只是想简化代码并快速实现功能,cv2.VideoCapture 会更方便。但它依赖于 OpenCV 和 FFmpeg 的封装,可能无法像直接使用 FFmpeg 那样精细调整解码行为。
建议:如果你的应用对实时性、低延迟和高性能有较高要求,尤其是在需要处理高帧率视频流的情况下,直接使用 FFmpeg 会更好。如果你需要快速开发并且不在乎一些细节的优化,使用 cv2.VideoCapture 会是一个简单方便的选择。

芝加哥时间深夜2点,休息了,晚安。
 


http://www.kler.cn/a/535384.html

相关文章:

  • JVM图文入门
  • ElasticSearch入门
  • AllData数据中台核心菜单十二:数据同步平台
  • java项目全局拦截器
  • 小程序越来越智能化,作为设计师要如何进行创新设计
  • go-zero学习笔记(三)
  • idea整合deepseek实现AI辅助编程
  • 【React】表单校验:从基础到集成库
  • Chapter 4-1. Troubleshooting Congestion in Fibre Channel Fabrics
  • π0开源了且推出自回归版π0-FAST——打造机器人动作专用的高效Tokenizer:比扩散π0的训练速度快5倍但效果相当
  • 2025_1_31 C语言中关于数组和指针
  • CentOS 7.9-2207更换实时内核
  • 【2025最新计算机毕业设计】基于SSM的智能停车场管理系统【提供源码+答辩PPT+文档+项目部署】(高质量源码,可定制,提供文档,免费部署到本地)
  • 使用 cipher /w 清除磁盘删除残留数据(Windows) - 随笔
  • Android版Kotlin版RxJava2+Retrofit2+OkHttp3的基础、封装和项目中的使用
  • 【工具篇】ChatGPT:开启人工智能新纪元
  • React 打印插件 -- react-to-print
  • C++中的pair,pair和map的结合
  • 接口对象封装思想及实现-笔记
  • Servlet笔记(下)
  • 数据结构与算法学习笔记----博弈论
  • [转]Java面试近一个月的面试总结
  • ElasticSearch业务场景与面试题
  • PCA9685舵机控制板使用
  • OpenBMC:通过qemu-system-arm运行编译好的image
  • Windows编程:下载与安装 Visual Studio 2010