opencv入门学习总结
opencv学习总结
不多bb,直接上代码!!!
案例一:
import cv2
# 返回当前安装的 OpenCV 库的版本信息 并且是字符串格式
print(cv2.getVersionString())
"""
作用:它可以读取不同格式的图像文件并将其转换为一个 NumPy 数组
image = cv2.imread(filename, flags)
filename: 要读取的图像文件路径,支持绝对路径和相对路径。
flags(可选): 指定图像读取的方式,控制图像的加载格式。这个参数是可选的,默认为 cv2.IMREAD_COLOR
cv2.IMREAD_COLOR: 以彩色图像加载,忽略图像的透明度(默认值)。rgb
cv2.IMREAD_GRAYSCALE: 以灰度图像加载,返回一个单通道图像(没有颜色信息)
cv2.IMREAD_UNCHANGED: 加载图像包括其 alpha 通道,即加载图像时包括透明度信息(如果有的话)。rgba
"""
image = cv2.imread("opencv_logo.jpg")
print(image.shape)
"""
作用:用于在窗口中显示图像。该函数可以将图像或视频帧显示在一个新的窗口中。
cv2.imshow(window_name, image)
window_name:窗口的名称,是一个字符串类型的参数
image:要显示的图像。它通常是一个 NumPy 数组,表示图像数据
"""
cv2.imshow("image", image)
# 等待用户输入(例如按键事件)任意按键退出
"""
作用:用于等待用户输入键盘事件
cv2.waitKey(delay)
delay: 延迟时间,单位:毫秒
"""
cv2.waitKey()
# 关闭所有打开的窗口
cv2.destroyAllWindows()
案例二:
import cv2
image = cv2.imread("opencv_logo.jpg")
"""
1.这段代码展示了如何分别显示 OpenCV 彩色图像的三个颜色通道(蓝色、绿色和红色)单独的图像。
2.OpenCV 中加载的彩色图像是以 BGR(蓝色、绿色、红色)顺序存储的,而不是常见的 RGB 顺序。
image[:, :, 0]: 表示图像的蓝色通道。
image[:, :, 1]: 表示图像的绿色通道。
image[:, :, 1]: 表示图像的红色通道。
这里使用了数组的切片,返回了一个二维数组。
例如:
import numpy as np
# 假设这是一个 3x3 的图像,每个像素有 3 个通道
image = np.array([[[100, 150, 200], [120, 170, 220], [140, 190, 240]],
[[110, 160, 210], [130, 180, 230], [150, 200, 250]],
[[120, 170, 220], [140, 190, 240], [160, 210, 260]]])
# 提取蓝色通道
blue_channel = image[:, :, 0]
print(blue_channel)
输出:[[100 120 140]
[110 130 150]
[120 140 160]]
"""
cv2.imshow("blue", image[:, :, 0])
cv2.imshow("green", image[:, :, 1])
cv2.imshow("red", image[:, :, 2])
"""
作用:将图像从一种颜色空间转换到另一种颜色空间
cv2.cvtColor(src, code)
src:输入图像,通常是一个 NumPy 数组(例如通过 cv2.imread() 读取的图像)。
code:颜色空间转换代码,指定要应用的转换类型
常见的几种:
cv2.COLOR_BGR2RGB:从 BGR 转换为 RGB。
cv2.COLOR_BGR2GRAY:从 BGR 转换为灰度图像。
cv2.COLOR_RGB2BGR:从 RGB 转换为 BGR。
"""
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2.imshow("gray", gray)
cv2.waitKey()
案例三:
import cv2
# 是在对一个图像 image 进行切割操作,返回一个新的图像区域
image = cv2.imread("opencv_logo.jpg")
crop = image[10:170, 40:200]
cv2.imshow("crop", crop)
cv2.waitKey()
案例四:
import cv2
import numpy as np
image = np.zeros([300, 300, 3], dtype=np.uint8)
"""
作用:在图像上绘制一条直线
cv2.line(image, start_point, end_point, color, thickness)
image:要在其上绘制线条的图像(通常是一个 NumPy 数组)。
start_point:线条的起始点坐标,格式为 (x, y),其中 x 是水平坐标(列),y 是垂直坐标(行)。
end_point:线条的结束点坐标,格式为 (x, y)。
color:线条的颜色,通常是 BGR 格式的元组,即 (蓝色, 绿色, 红色)。
thickness:线条的粗细,单位是像素。
"""
cv2.line(image, (100, 200), (250, 250), (255, 0, 0), 2)
"""
作用:在图像上绘制一个矩形
cv2.rectangle(image, start_point, end_point, color, thickness)
image:目标图像,矩形将被绘制在此图像上。
start_point:矩形的左上角坐标,格式为 (x, y),其中 x 为水平坐标(列),y 为垂直坐标(行)
end_point:矩形的右下角坐标,格式同样为 (x, y)。
color:矩形的颜色,采用 BGR(蓝色、绿色、红色)格式。
thickness:线条的粗细,单位是像素。
"""
cv2.rectangle(image, (30, 100), (60, 150), (0, 255, 0), 2)
"""
作用:在图像上绘制一个圆形
cv2.circle(image, center, radius, color, thickness)
image:目标图像,圆形将被绘制在此图像上。
center:圆形的中心点坐标,格式为 (x, y),其中 x 为水平坐标(列),y 为垂直坐标(行)。
radius:圆形的半径,单位为像素。
color:圆形的颜色,采用 BGR(蓝色、绿色、红色)格式。
thickness:圆形的边框宽度,单位为像素。如果设置为负值(如 -1),则表示填充圆形。
"""
cv2.circle(image, (150, 100), 20, (0, 0, 255), 3)
"""
作用:在图像上添加文本
cv2.putText(image, text, position, font, font_scale, color, thickness, line_type)
image:目标图像,文本将被绘制在此图像上。
text:要绘制的文本字符串。
position:文本的左下角位置(起始坐标),格式为 (x, y),其中 x 是水平坐标(列),y 是垂直坐标(行)。
font:字体类型(通过 OpenCV 提供的常量来指定)。0 表示使用 OpenCV 默认字体 cv2.FONT_HERSHEY_SIMPLEX
font_scale:字体的缩放比例(即字体大小)。
color:文本颜色,采用 BGR(蓝色、绿色、红色)格式。
thickness:文本的线条粗细,单位为像素。
line_type:线条类型,用于指定文本的抗锯齿(通常设置为 1 表示抗锯齿)。
"""
cv2.putText(image, "hello", (100, 50), 0, 1, (255, 255, 255), 2, 1)
cv2.imshow("image", image)
cv2.waitKey()
案例5:
首先我们先明白什么是噪点?
噪点(Noise) 是指图像中出现的随机、无关的像素值,它们通常表现为干扰、杂散的亮度或颜色变化,可能会影响图像的质量和分析。噪点通常是由于图像捕获、传输、处理等过程中引入的误差或不稳定因素。
如何去除噪点?
去噪点(去噪)是图像处理中常见且重要的一步,目的是减少图像中的噪声,恢复图像的质量和细节。不同类型的噪点(如椒盐噪声、高斯噪声等)可以通过不同的去噪方法进行处理。下面是一些常见的去噪方法:
import cv2
image = cv2.imread("plane.jpg")
# 用均值滤波去除噪点
mean_blur = cv2.blur(image, (5, 5)) # 5x5 窗口
# 用高斯滤波去除噪点
gauss = cv2.GaussianBlur(image, (5, 5), 0) # 5x5 窗口 标准差为 0
# 用中值滤波去除噪点
median = cv2.medianBlur(image, 5) # 5 是邻域大小
# 用双边滤波去除噪点
# 参数1:直径,参数2:颜色空间标准差,参数3:坐标空间标准差
bilateral_blur = cv2.bilateralFilter(image, 9, 75, 75)
cv2.imshow("image", image)
cv2.imshow("mean_blur", mean_blur)
cv2.imshow("gauss", gauss)
cv2.imshow("median", median)
cv2.imshow("bilateral_blur", bilateral_blur)
cv2.waitKey()
除了以上opencv中自带的函数去除噪点,还可以使用深度学习模型更好的去除噪点。
OpenCV本身并不直接提供深度学习去噪的实现,但你可以利用深度学习框架(如TensorFlow、PyTorch等)和预训练的去噪模型(如DnCNN、U-Net等)来进行去噪。下面是一个使用深度学习去噪的简化示例(假设你已经有一个训练好的模型)。
import cv2
import torch
import numpy as np
# 加载训练好的模型 (假设你已经训练了一个去噪模型)
model = torch.load("denoising_model.pth") # 这是一个假设的模型路径
model.eval()
# 读取图像
image = cv2.imread("plane.jpg")
image_tensor = torch.from_numpy(image).float().unsqueeze(0).unsqueeze(0) # 转换为 PyTorch Tensor
# 将图像输入模型进行去噪
with torch.no_grad():
denoised_image_tensor = model(image_tensor)
# 将去噪后的 Tensor 转换回图像格式
denoised_image = denoised_image_tensor.squeeze().numpy().astype(np.uint8)
# 显示原图像和去噪后的图像
cv2.imshow("Original Image", image)
cv2.imshow("Denoised Image (Deep Learning)", denoised_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
总结:
1. 均值滤波:适用于轻度噪声,简单但可能模糊图像细节。
2. 中值滤波:特别适用于去除椒盐噪声,能够保留边缘细节。
3. 高斯滤波:适用于去除高斯噪声,可以有效平滑图像。
4. 双边滤波:去噪的同时能够保留图像边缘,适用于需要保持细节的情况。
5. 深度学习去噪:通常提供最好的去噪效果,尤其适用于复杂的噪声类型,但需要预训练的深度学习模型和计算资源。
可以根据噪声的类型和图像的特性选择合适的去噪方法。
总结:
1. 均值滤波:适用于轻度噪声,简单但可能模糊图像细节。
2. 中值滤波:特别适用于去除椒盐噪声,能够保留边缘细节。
3. 高斯滤波:适用于去除高斯噪声,可以有效平滑图像。
4. 双边滤波:去噪的同时能够保留图像边缘,适用于需要保持细节的情况。
5. 深度学习去噪:通常提供最好的去噪效果,尤其适用于复杂的噪声类型,但需要预训练的深度学习模型和计算资源。
可以根据噪声的类型和图像的特性选择合适的去噪方法。