当前位置：首页 > article >正文

Python----计算机视觉处理（Opencv：图像边缘检测：非极大值抑制，双阈值筛选)

article 2025/3/29 3:25:31

一、高斯滤波

边缘检测本身属于锐化操作，对噪点比较敏感，所以需要进行平滑处理。这里使用的是一个5*5的高斯核对图像进行消除噪声。

二、计算图像的梯度和方向

三、非极大值抑制

在得到每个边缘的方向之后，其实把它们连起来边缘检测就算完了，经过第二步得到的边缘不经过处理是没办法使用的，因为高斯滤波的原因，边缘会变得模糊，导致经过第二步后得到的边缘像素点非常多，因此我们需要对其进行一些过滤操作，而非极大值抑制就是一个很好的方法，它会对得到的边缘像素进行一个排除，使边缘尽可能细一点。

在该步骤中，我们需要检查每个像素点的梯度方向上的相邻像素，并保留梯度值最大的像素，将其他像素抑制为零。假设当前像素点为（x，y），其梯度方向是0°，梯度值为G（x，y），那么我们就需要比较G（x，y）与两个相邻像素的梯度值：G（x-1，y）和G（x+1，y）。如果G（x，y）是三个值里面最大的，就保留该像素值，否则将其抑制为零。

并且如果梯度方向不是0°、45°、90°、135°这种特定角度，那么就要用到插值算法来计算当前像素点在其方向上进行插值的结果了，然后进行比较并判断是否保留该像素点。这里使用的是单线性插值，通过 A1和A2两个像素点获得dTmp1与dTmp2处的插值，然后与中心点C进行比较。具体的插值算法请参考图像旋转实验。

四、双阈值筛选

经过非极大值抑制之后，我们还需要设置阈值来进行筛选，当阈值设的太低，就会出现假边缘，而阈值设的太高，一些较弱的边缘就会被丢掉，因此使用了双阈值来进行筛选，推荐高低阈值的比例为2：1到 3：1之间

当某一像素位置的幅值超过最高阈值时，该像素必是边缘像素；当幅值低于最低像素时，该像素必不是边缘像素；幅值处于最高像素与最低像素之间时，如果它能连接到一个高于阈值的边缘时，则被认为是边缘像素，否则就不会被认为是边缘。

也就是说，上图中的A和C是边缘，B不是边缘。因为C虽然不超过最高阈值，但其与A相连，所以C就是边缘。

具体来说，对于非极大值抑制之后的图像来说，设置两个阈值threshold1和threshold2，其中 threshold1是低阈值，threshold2是高阈值。然后遍历图像，把梯度值小于低阈值的点的梯度值设为 0，得到图像1，把梯度值小于高阈值的点的梯度值设为0，得到图像2。由于图像2的阈值比较高，所以其中会损失掉很多有用的图像信息，而图像1的阈值比较低，所以会保留很多的信息，包括真正的边缘和虚假的边缘。

那么我们就可以以图像2为基础，以图像1为补充来连接图像的边缘，其具体步骤为：

• 对图像2进行遍历，当遇到一个非零的像素点P时，记录以P为开始的轮廓线，知道轮廓线的终点位置Q。

• 考察图像1中与图像2中的Q点位置对应的点S的8邻近区域，如果在S点的8邻近区域内有非零像素存在，就将其作为边界点放入图像2中作为点R。然后再从点R开始重复第一步，直到在图像1和图像2 中都无法继续为止。

• 当完成对包含点P的轮廓线的寻找之后，将这条轮廓线标为已寻找，然后接着寻找下一条轮廓，就是重复第1步、第2步、第3步，直到图像2中找不到新的轮廓为止。

经过筛选之后的所保存下来的点就是我们图像中的边缘点了

五、图像边缘检测

5.1、有二值化

导入模块

import cv2

输入图像

img=cv2.imread('lenda01.png')

灰度化

img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

二值化

ret1,img_threshold1=cv2.threshold(img_gray,127,255,cv2.THRESH_BINARY)

高斯滤波

img_Guss1=cv2.GaussianBlur(img_threshold1,(5,5),sigmaX=1.5)

梯度与方向

非极大值抑制

双阈值筛选

img_Canny1=cv2.Canny(img_Guss1,122,127,L2gradient=True)

输出图像

cv2.imshow('img',img)
cv2.imshow('img_Canny1',img_Canny1)
cv2.waitKey(0)

完整代码

import cv2  

img = cv2.imread('lenda01.png')  

# 将图像从BGR颜色空间转换为灰度图像  
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  

# 使用全局阈值进行二值化处理  
#   - ret1:  计算得到的阈值 (127)  
#   - img_threshold1:  二值化后的图像，像素值大于127设置为255，否则设置为0  
ret1, img_threshold1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)  

# 使用 Otsu's 阈值法进行二值化处理，并进行反转  
#   - ret2:  Otsu's算法计算得到的阈值  
#   - img_threshold2:  二值化后的图像，像素值小于阈值设置为255，否则设置为0  
ret2, img_threshold2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_OTSU + cv2.THRESH_BINARY_INV)  

# 对二值化后的图像进行高斯模糊处理，以减少噪声  
#   - img_threshold1:  输入图像（二值化后的图像）  
#   - (5, 5):  高斯核的大小  
#   - sigmaX=1.5:  X方向上的高斯核标准差  
img_Guss1 = cv2.GaussianBlur(img_threshold1, (5, 5), sigmaX=1.5)  

# 使用 Canny 边缘检测算法提取图像的边缘  
#   - img_Guss1:  输入图像（高斯模糊后的二值化图像）  
#   - ret2:  低阈值，用于边缘检测的阈值下限 (这里使用Otsu算法计算得到的阈值)  
#   - ret1:  高阈值，用于边缘检测的阈值上限 (这里使用固定阈值127)  
#   - L2gradient=True:  使用 L2 范数计算图像梯度，更准确  
img_Canny1 = cv2.Canny(img_Guss1, ret2, ret1, L2gradient=True)  

# 显示原始图像  
cv2.imshow('img', img)  
# 显示 Canny 边缘检测后的图像  
cv2.imshow('img_Canny1', img_Canny1)  
# 等待用户按下键盘上的任意键  
cv2.waitKey(0)

5.2、无二值化

import cv2

img = cv2.imread('lenda01.png')

# 将图像从BGR颜色空间转换为灰度图像
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 使用全局阈值进行二值化处理
#   - ret1:  计算得到的阈值 (127)
#   - img_threshold1:  二值化后的图像，像素值大于127设置为255，否则设置为0
ret1, img_threshold1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)

# 使用 Otsu's 阈值法进行二值化处理，并进行反转
#   - ret2:  Otsu's算法计算得到的阈值
#   - img_threshold2:  二值化后的图像，像素值小于阈值设置为255，否则设置为0
ret2, img_threshold2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_OTSU + cv2.THRESH_BINARY_INV)

# 对灰度图像进行高斯模糊处理，以减少噪声
#   - (5, 5):  高斯核的大小
#   - sigmaX=1.5:  X方向上的高斯核标准差
img_Guss2 = cv2.GaussianBlur(img_gray, (5, 5), sigmaX=1.5)

# 使用 Canny 边缘检测算法提取图像的边缘
#   - img_Guss2:  输入图像（高斯模糊后的灰度图像）
#   - ret2:  低阈值，用于边缘检测的阈值下限
#   - ret1:  高阈值，用于边缘检测的阈值上限
#   - L2gradient=True:  使用 L2 范数计算图像梯度，更准确
img_Canny2 = cv2.Canny(img_Guss2, ret2, ret1, L2gradient=True)

# 显示原始图像
cv2.imshow('img', img)
# 显示 Canny 边缘检测后的图像
cv2.imshow('img_Canny2', img_Canny2)
# 等待用户按下键盘上的任意键
cv2.waitKey(0)
```

六、库函数

Canny()

使用 Canny 算法查找图像中的边缘

该函数在输入图像中查找边缘，并使用 Canny 算法在输出映射边缘中标记它们。threshold1 和 threshold2 之间的最小值用于 Edge 链接。最大值用于查找强边缘的初始分段。查看 http://en.wikipedia.org/wiki/Canny_edge_detector

cv.Canny(	image, threshold1, threshold2[, edges[, apertureSize[, L2gradient]]]	) ->	edges
cv.Canny(	dx, dy, threshold1, threshold2[, edges[, L2gradient]]	) ->	edges

方法	描述
image	8 位输入图像。
edges	输出边缘映射;单通道 8 位图像，其大小与图像相同。
threshold1	磁滞过程的第一个阈值。
threshold2	滞后程序的第二个阈值。
apertureSize	孔径大小。
L2gradient
dx	输入图像的 16 位 x 导数（CV_16SC1 或 CV_16SC3）
dy	输入图像的 16 位 y 导数（与 dx 类型相同）。