当前位置: 首页 > article >正文

C++基于opencv的视频质量检测--遮挡检测

文章目录

    • 0.引言
    • 1. 原始代码分析
      • 1.1 存在的问题
    • 2. 优化方案
    • 3. 优化后的代码
    • 4. 代码详细解读
      • 4.1. 输入检查
      • 4.2. 图像预处理
      • 4.3. 高斯模糊
      • 4.4. 梯度计算
      • 4.5. 计算梯度幅值和方向
      • 4.6. 边缘检测
      • 4.7. 计算边缘密度
      • 4.8. 估计遮挡程度
      • 4.9. 限定结果范围
      • 4.10. 返回结果

0.引言

视频质量遮挡检测已在C++基于opencv4的视频质量检测中有所介绍,本文将详细介绍其优化版本。

1. 原始代码分析

首先,我们来看遮挡检测的原始代码:

#include <opencv2/opencv.hpp>
#include <vector>

/**
 * @brief 检测图像中的遮挡情况。
 * @param [in] srcImg 输入的图像
 * @return 返回一个double类型的数值,范围为0到1。数值越接近1,表示图像中的遮挡程度越高。
 */
double blockDetect(const cv::Mat& srcImg) {
    if (srcImg.empty()) {
        return -1.0;  // 如果输入图像为空,返回-1表示错误
    }

    cv::Mat grayImg, edges;
    cv::cvtColor(srcImg, grayImg, cv::COLOR_BGR2GRAY);
    cv::GaussianBlur(grayImg, grayImg, cv::Size(3, 3), 0);
    cv::Canny(grayImg, edges, 0, 0);

    std::vector<std::vector<cv::Point>> contours;
    std::vector<cv::Vec4i> hierarchy;

    // 初始轮廓检测
    cv::findContours(edges, contours, hierarchy, cv::RETR_CCOMP, cv::CHAIN_APPROX_SIMPLE);
    int initialContourCount = static_cast<int>(hierarchy.size());

    // 细化后的轮廓检测
    cv::Canny(grayImg, edges, 0, 15);
    cv::findContours(edges, contours, hierarchy, cv::RETR_CCOMP, cv::CHAIN_APPROX_SIMPLE);
    int refinedContourCount = static_cast<int>(hierarchy.size());

    // 防止除以零的情况
    if (initialContourCount == 0) {
        initialContourCount = 1;
    }

    double occlusionLevel = 1.0 - static_cast<double>(refinedContourCount) / static_cast<double>(initialContourCount);
    return occlusionLevel;
}

1.1 存在的问题

  1. Canny边缘检测的阈值设置不合理:在Canny函数中,阈值设为00,以及015,这可能导致边缘检测结果不可靠。

  2. 错误处理不够明确:当输入图像为空时,返回-1.0,但这个值可能与正常的遮挡程度值混淆。

2. 优化方案

针对上述问题,我们对代码进行如下优化:

  • 自适应阈值设置:根据图像的特性动态设置Canny边缘检测的阈值,提高边缘检测的可靠性。

  • 提高代码可读性:增加详细的注释,使用更具描述性的变量名,提升代码的可读性和可维护性。

  • 算法改进:使用Sobel算子计算梯度,基于边缘密度来判断遮挡程度,获得更准确的结果。

3. 优化后的代码

#include <opencv2/opencv.hpp>
#include <vector>

/**
 * @brief 检测图像中的遮挡情况。
 * @param srcImg 输入的图像
 * @return 如果成功,返回一个介于0到1之间的double类型值,值越接近1表示遮挡程度越高;
 *         如果输入图像为空,返回-1.0。
 */
double occlusionDetect(const cv::Mat& srcImg) {
    if (srcImg.empty()) {
        // 输入图像为空
        return -1.0;
    }

    // 将图像转换为灰度图
    cv::Mat grayImg;
    if (srcImg.channels() == 3) {
        cv::cvtColor(srcImg, grayImg, cv::COLOR_BGR2GRAY);
    } else {
        grayImg = srcImg.clone();
    }

    // 对灰度图进行高斯模糊,减少噪声
    cv::GaussianBlur(grayImg, grayImg, cv::Size(5, 5), 0);

    // 使用Sobel算子计算梯度
    cv::Mat gradX, gradY;
    cv::Sobel(grayImg, gradX, CV_64F, 1, 0, 3);
    cv::Sobel(grayImg, gradY, CV_64F, 0, 1, 3);

    // 计算梯度幅值和方向
    cv::Mat magnitude, angle;
    cv::cartToPolar(gradX, gradY, magnitude, angle, true);

    // 对梯度幅值进行阈值化,得到边缘图
    double maxVal;
    cv::minMaxLoc(magnitude, nullptr, &maxVal);
    cv::Mat edges;
    cv::threshold(magnitude, edges, 0.1 * maxVal, 255, cv::THRESH_BINARY);

    // 计算边缘密度
    double edgeDensity = cv::countNonZero(edges) / static_cast<double>(edges.total());

    // 根据边缘密度估计遮挡程度(假设遮挡区域边缘密度较低)
    double occlusionLevel = 1.0 - edgeDensity;

    // 将结果限定在0到1之间
    occlusionLevel = std::clamp(occlusionLevel, 0.0, 1.0);

    return occlusionLevel;
}

4. 代码详细解读

开始
输入图像是否为空
返回 std::nullopt
转换为灰度图 grayImg
高斯模糊处理
计算梯度 gradX 和 gradY
计算梯度幅值和方向
获取最大值 maxVal
阈值化得到 edges
计算边缘密度 edgeDensity
计算遮挡程度 occlusionLevel
限定 occlusionLevel 在0到1之间
返回 occlusionLevel

4.1. 输入检查

if (srcImg.empty()) {
    return std::nullopt;
}
  • 目的:确保输入的图像有效。
  • 说明:如果输入图像为空,函数返回std::nullopt,明确表示错误状态。

4.2. 图像预处理

cv::Mat grayImg;
if (srcImg.channels() == 3) {
    cv::cvtColor(srcImg, grayImg, cv::COLOR_BGR2GRAY);
} else {
    grayImg = srcImg.clone();
}
  • 目的:将彩色图像转换为灰度图像。
  • 说明:灰度图像降低了计算复杂度,适用于后续的梯度和边缘检测。

4.3. 高斯模糊

cv::GaussianBlur(grayImg, grayImg, cv::Size(5, 5), 0);
  • 目的:平滑图像,减少噪声对梯度计算的影响。
  • 参数解释
    • cv::Size(5, 5):高斯核的大小,可根据需要调整。
    • 0:高斯核在x方向的标准差,设为0表示根据核大小自动计算。

4.4. 梯度计算

cv::Mat gradX, gradY;
cv::Sobel(grayImg, gradX, CV_64F, 1, 0, 3);
cv::Sobel(grayImg, gradY, CV_64F, 0, 1, 3);
  • 目的:计算图像在x和y方向的梯度。
  • 参数解释
    • CV_64F:使用64位浮点型,确保梯度值的精度。
    • 1, 00, 1:指定导数的阶数,分别计算x和y方向的一阶导数。
    • 3:Sobel核的大小。

4.5. 计算梯度幅值和方向

cv::Mat magnitude, angle;
cv::cartToPolar(gradX, gradY, magnitude, angle, true);
  • 目的:将梯度的x和y分量转换为极坐标形式,得到梯度的幅值和方向。
  • 参数解释
    • true:将角度值转换为度数(0-360),否则为弧度。

4.6. 边缘检测

double maxVal;
cv::minMaxLoc(magnitude, nullptr, &maxVal);
cv::Mat edges;
cv::threshold(magnitude, edges, 0.1 * maxVal, 255, cv::THRESH_BINARY);
  • 目的:通过阈值化梯度幅值,提取边缘。
  • 步骤
    • 使用cv::minMaxLoc获取梯度幅值的最大值maxVal
    • 设定阈值为0.1 * maxVal,将高于此阈值的像素设为255(白色),其余设为0(黑色)。

4.7. 计算边缘密度

double edgeDensity = cv::countNonZero(edges) / static_cast<double>(edges.total());
  • 目的:计算边缘像素占总像素的比例。
  • 说明:边缘密度反映了图像中边缘信息的丰富程度。

4.8. 估计遮挡程度

double occlusionLevel = 1.0 - edgeDensity;
  • 目的:根据边缘密度估计遮挡程度。
  • 假设:遮挡区域的边缘密度较低,因此边缘密度越小,遮挡程度越高。

4.9. 限定结果范围

occlusionLevel = std::clamp(occlusionLevel, 0.0, 1.0);
  • 目的:确保遮挡程度在有效范围内。

4.10. 返回结果

return occlusionLevel;
  • 说明:返回的occlusionLeveldouble类型,范围在0到1之间。
  • 无遮挡图像occlusionLevel值接近于0,表示遮挡程度低。
  • 遮挡图像occlusionLevel值接近于1,表示遮挡程度高。

http://www.kler.cn/a/374443.html

相关文章:

  • C#调用OpenXml,读取excel行数据,遇到空单元跳过现象处理
  • 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之分支结构(实战训练三)
  • 从数据仓库到数据中台再到数据飞轮:电信行业的数据技术进化史
  • 选择FPGA开发,学历是硬性要求吗?
  • vue3项目history路由模式部署上线405、刷新404问题(包括部分页面刷新404问题)
  • JS中若干相似特性的区别
  • pytest高版本兼容test_data[“log“] = _handle_ansi(“\n“.join(logs))错误
  • 安装Docker环境的两种方式
  • 反序列化漏洞的运行原理及防御方法
  • Halcon-模板匹配(WPF)
  • 【Linux系统编程】第四十弹---深入理解操作系统:信号捕捉、可重入函数、volatile关键字与SIGCHLD信号解析
  • 从Flux Dev蒸馏出来的模型——Flux.1 Lite
  • rom定制系列------红米note8_miui14安卓13定制修改固件 带面具root权限 刷写以及界面预览
  • 灵动AI视频 —— 创意无界,视频新生
  • Qt限制QGraphicsScene QGraphicsItem内部的移动范围
  • mac 使用命令卸载Node.js
  • Qt指定程序编译生成文件的位置
  • 使用 pkg 打包 Puppeteer 应用:跨平台自动化的轻量级选择
  • 管家婆财贸ERP BB072.销售单草稿明细生成组装拆分单
  • [实战-11] FlinkSql设置时区(table.local-time-zone)
  • MySQL 的 select * 会用到事务吗?
  • Ethernet 系列(6)-- 基础学习::OSI Model
  • 金融小白两周完成一个量化系统 (二)项目进度以及数据获取
  • 数据分析可视化:散点图矩阵与雷达图的生成
  • 时序数据分析:工业时序数据的特点
  • 【python ASR】win11-从0到1使用funasr实现本地离线音频转文本