当前位置：首页 > article >正文

机器视觉基础系列四—简单了解背景建模算法

article 2024/10/22 15:31:26

机器视觉基础系列四—简单了解背景建模算法

首先我们应该了解的是背景建模的定义是什么？又有哪些应用场景呢？

背景建模是指通过分析视频序列中的像素值变化情况，从中提取出静态背景部分，并将其用于目标检测、运动跟踪等计算机视觉任务中。在实际应用中，背景建模常用于视频监控、行人检测、车辆识别等领域。

在视频中，背景通常被定义为相对稳定的部分，例如墙壁、地面或天空等。背景建模的目标是将动态的前景对象与静态的背景进行分离，以便进一步分析和处理。

帧差法—背景建模

背景建模最简单的一种方法就是使用帧差法进行背景的建模。

帧差法实际上也是一种传统的目标跟踪算法有有一定的优点和缺点。

优点是算法实现简单，程序设计复杂度低；对光线等场景变化不太敏感，能够适应各种动态环境，有着比较强的鲁棒性。
缺点是不能提取出对象的完整区域，对象内部有“空洞”，只能提取出边界，边界轮廓比较粗，往往比实际物体要大。对快速运动的物体，容易出现鬼影的现象，甚至会被检测为两个不同的运动物体，对慢速运动的物体，当物体在前后两帧中几乎完全重叠时，则检测不到物体。故该方法一般适用于简单的实时运动检测的情况。

在这里插入图片描述

由于场景中的目标在运动，该类算法对时间上连续的两帧图像进行差分运算，不同帧对应的像素点相减，判断灰度差目标的影像在不同图像帧中的位置不同。，当绝对值超过—阈值时，即可判断为运动目标，从而实现目标的检测功能。

其对应的公式表示为：

$\begin{array}{l} D_{n}(x, y)=\left|f_{n}(x, y)-f_{n-1}(x, y)\right| \\ R_{n}^{\prime}(x, y)=\left\{\begin{array}{l} 255, D_{n}(x, y)>T \\ 0, \text { else } \end{array}\right. \end{array}$

我们对这一个公式简单的来进行一下解读，fn代表的是第n帧图像（x,y）位置处的像素点。fn-1代表的是该像素点在上一帧的像素值。

如何其值为0代表该点没有在视频中发生运动可以视为背景，若发生变化则表示的是该物体进行运动。255白色保留

帧差法非常简单，但是会引入噪音和空洞问题这个算法实际上更像说是一种背景消除的操作，我们对背景的信息进行了过滤。

混合高斯模型—GMM

GMM的公式推导

这里的Gmm高斯混合模型实际上也就是对应机器学习中的高斯混合聚类的推导过程。

定义：

$P(\boldsymbol{x})=\sum_{i=1}^{k} \alpha_{i} \cdot \phi\left(\boldsymbol{x} \mid \boldsymbol{\mu}_{i}, \boldsymbol{\Sigma}_{i}\right)$

该模型由K个混合成分组成，每个混合成分为一个高斯分布，其中x属于Rn而a i是混合系数。

$\alpha_{i} \geq 0, \sum_{i=1}^{k} \alpha_{i}=1, \phi\left(x \mid \boldsymbol{\mu}_{i}, \boldsymbol{\Sigma}_{i}\right) \text { 为多元高斯分布 }$

$\phi\left(\boldsymbol{x} \mid \boldsymbol{\mu}_{i}, \boldsymbol{\Sigma}_{i}\right)=\frac{1}{(2 \pi)^{\frac{n}{2}}\left|\boldsymbol{\Sigma}_{i}\right|^{\frac{1}{2}}} \exp \left(-\frac{1}{2}\left(\boldsymbol{x}-\boldsymbol{\mu}_{i}\right)^{\mathrm{T}} \boldsymbol{\Sigma}_{i}^{-1}\left(\boldsymbol{x}-\boldsymbol{\mu}_{i}\right)\right)$

其生成数据的方式为：首先，依概率ai：选择第i个高斯混合成分。接着根据该混合模型的概率分布

$\phi\left(\boldsymbol{x} \mid \boldsymbol{\mu}_{i}, \boldsymbol{\Sigma}_{i}\right)$

来生成样本。

已知数据集D={x1,x2，···xm}中的样本中的样本均由某个高斯混合模型生成，而每个样本是由哪个高斯混合成分生成的是未知的，属于一个隐变量，我们令其为zj∈{1，2，.,k}表示生成样本xj的高斯混合成分，结合高斯混合模型生成数据的方式易知的分布律为P（zj=i）=ai

可以用EM算法来进行求解。

GMM背景建模应用

在进行前景检测前，先对背景进行训练，对图像中每个背景采用一个混合高斯模型进行模拟，每个背景的混合高斯的个数可以自适应。然后在测试阶段，对新来的像素进行GMM匹配，如果该像素值能够匹配其中一个高斯，则认为是背景，否则认为是前景。由于整个过程GMM模型在不断更新学习中，所以对动态背景有一定的鲁棒性。最后通过对一个有树枝摇摆的动态背景进行前景检测，取得了较好的效果。