当前位置: 首页 > article >正文

opencv入门学习总结

opencv学习总结

不多bb,直接上代码!!!
案例一:

import cv2
# 返回当前安装的 OpenCV 库的版本信息 并且是字符串格式
print(cv2.getVersionString())
"""
作用:它可以读取不同格式的图像文件并将其转换为一个 NumPy 数组
    image = cv2.imread(filename, flags)
    filename: 要读取的图像文件路径,支持绝对路径和相对路径。
    flags(可选): 指定图像读取的方式,控制图像的加载格式。这个参数是可选的,默认为 cv2.IMREAD_COLOR
            cv2.IMREAD_COLOR: 以彩色图像加载,忽略图像的透明度(默认值)。rgb
            cv2.IMREAD_GRAYSCALE: 以灰度图像加载,返回一个单通道图像(没有颜色信息)
            cv2.IMREAD_UNCHANGED: 加载图像包括其 alpha 通道,即加载图像时包括透明度信息(如果有的话)。rgba
"""
image = cv2.imread("opencv_logo.jpg")
print(image.shape)

"""
作用:用于在窗口中显示图像。该函数可以将图像或视频帧显示在一个新的窗口中。
    cv2.imshow(window_name, image)
    window_name:窗口的名称,是一个字符串类型的参数
    image:要显示的图像。它通常是一个 NumPy 数组,表示图像数据
"""
cv2.imshow("image", image)
# 等待用户输入(例如按键事件)任意按键退出

"""
作用:用于等待用户输入键盘事件
    cv2.waitKey(delay)
    delay: 延迟时间,单位:毫秒
"""
cv2.waitKey()


# 关闭所有打开的窗口
cv2.destroyAllWindows()

案例二:



import cv2

image = cv2.imread("opencv_logo.jpg")

"""
1.这段代码展示了如何分别显示 OpenCV 彩色图像的三个颜色通道(蓝色、绿色和红色)单独的图像。
2.OpenCV 中加载的彩色图像是以 BGR(蓝色、绿色、红色)顺序存储的,而不是常见的 RGB 顺序。
    image[:, :, 0]: 表示图像的蓝色通道。
    image[:, :, 1]: 表示图像的绿色通道。
    image[:, :, 1]: 表示图像的红色通道。
    这里使用了数组的切片,返回了一个二维数组。
    例如:
        import numpy as np
        
        # 假设这是一个 3x3 的图像,每个像素有 3 个通道
        image = np.array([[[100, 150, 200], [120, 170, 220], [140, 190, 240]],
                          [[110, 160, 210], [130, 180, 230], [150, 200, 250]],
                          [[120, 170, 220], [140, 190, 240], [160, 210, 260]]])
        
        # 提取蓝色通道
        blue_channel = image[:, :, 0]
        print(blue_channel)
        
    输出:[[100 120 140]
         [110 130 150]
         [120 140 160]]
"""
cv2.imshow("blue", image[:, :, 0])
cv2.imshow("green", image[:, :, 1])
cv2.imshow("red", image[:, :, 2])

"""
    作用:将图像从一种颜色空间转换到另一种颜色空间
    cv2.cvtColor(src, code)
        src:输入图像,通常是一个 NumPy 数组(例如通过 cv2.imread() 读取的图像)。
        code:颜色空间转换代码,指定要应用的转换类型
            常见的几种:
                cv2.COLOR_BGR2RGB:从 BGR 转换为 RGB。
                cv2.COLOR_BGR2GRAY:从 BGR 转换为灰度图像。
                cv2.COLOR_RGB2BGR:从 RGB 转换为 BGR。
"""
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2.imshow("gray", gray)

cv2.waitKey()


在这里插入图片描述

案例三:


import cv2
# 是在对一个图像 image 进行切割操作,返回一个新的图像区域
image = cv2.imread("opencv_logo.jpg")

crop = image[10:170, 40:200]

cv2.imshow("crop", crop)
cv2.waitKey()

在这里插入图片描述

案例四:


import cv2
import numpy as np

image = np.zeros([300, 300, 3], dtype=np.uint8)
"""
作用:在图像上绘制一条直线
    cv2.line(image, start_point, end_point, color, thickness)
    image:要在其上绘制线条的图像(通常是一个 NumPy 数组)。
    start_point:线条的起始点坐标,格式为 (x, y),其中 x 是水平坐标(列),y 是垂直坐标(行)。
    end_point:线条的结束点坐标,格式为 (x, y)。
    color:线条的颜色,通常是 BGR 格式的元组,即 (蓝色, 绿色, 红色)。
    thickness:线条的粗细,单位是像素。
"""
cv2.line(image, (100, 200), (250, 250), (255, 0, 0), 2)

"""
作用:在图像上绘制一个矩形
    cv2.rectangle(image, start_point, end_point, color, thickness)
    image:目标图像,矩形将被绘制在此图像上。
    start_point:矩形的左上角坐标,格式为 (x, y),其中 x 为水平坐标(列),y 为垂直坐标(行)
    end_point:矩形的右下角坐标,格式同样为 (x, y)。
    color:矩形的颜色,采用 BGR(蓝色、绿色、红色)格式。
    thickness:线条的粗细,单位是像素。
"""
cv2.rectangle(image, (30, 100), (60, 150), (0, 255, 0), 2)

"""
作用:在图像上绘制一个圆形
    cv2.circle(image, center, radius, color, thickness)
    image:目标图像,圆形将被绘制在此图像上。
    center:圆形的中心点坐标,格式为 (x, y),其中 x 为水平坐标(列),y 为垂直坐标(行)。
    radius:圆形的半径,单位为像素。
    color:圆形的颜色,采用 BGR(蓝色、绿色、红色)格式。
    thickness:圆形的边框宽度,单位为像素。如果设置为负值(如 -1),则表示填充圆形。
"""
cv2.circle(image, (150, 100), 20, (0, 0, 255), 3)

"""
作用:在图像上添加文本
    cv2.putText(image, text, position, font, font_scale, color, thickness, line_type)
    image:目标图像,文本将被绘制在此图像上。
    text:要绘制的文本字符串。
    position:文本的左下角位置(起始坐标),格式为 (x, y),其中 x 是水平坐标(列),y 是垂直坐标(行)。
    font:字体类型(通过 OpenCV 提供的常量来指定)。0 表示使用 OpenCV 默认字体 cv2.FONT_HERSHEY_SIMPLEX
    font_scale:字体的缩放比例(即字体大小)。
    color:文本颜色,采用 BGR(蓝色、绿色、红色)格式。
    thickness:文本的线条粗细,单位为像素。
    line_type:线条类型,用于指定文本的抗锯齿(通常设置为 1 表示抗锯齿)。
"""
cv2.putText(image, "hello", (100, 50), 0, 1, (255, 255, 255), 2, 1)

cv2.imshow("image", image)
cv2.waitKey()

在这里插入图片描述

案例5:

首先我们先明白什么是噪点?

噪点(Noise) 是指图像中出现的随机、无关的像素值,它们通常表现为干扰、杂散的亮度或颜色变化,可能会影响图像的质量和分析。噪点通常是由于图像捕获、传输、处理等过程中引入的误差或不稳定因素。

如何去除噪点?

​ 去噪点(去噪)是图像处理中常见且重要的一步,目的是减少图像中的噪声,恢复图像的质量和细节。不同类型的噪点(如椒盐噪声、高斯噪声等)可以通过不同的去噪方法进行处理。下面是一些常见的去噪方法:


import cv2

image = cv2.imread("plane.jpg")


# 用均值滤波去除噪点
mean_blur = cv2.blur(image, (5, 5))  # 5x5 窗口
# 用高斯滤波去除噪点
gauss = cv2.GaussianBlur(image, (5, 5), 0) # 5x5 窗口 标准差为 0
# 用中值滤波去除噪点
median = cv2.medianBlur(image, 5) # 5 是邻域大小
# 用双边滤波去除噪点
# 参数1:直径,参数2:颜色空间标准差,参数3:坐标空间标准差
bilateral_blur = cv2.bilateralFilter(image, 9, 75, 75)


cv2.imshow("image", image)
cv2.imshow("mean_blur", mean_blur)
cv2.imshow("gauss", gauss)
cv2.imshow("median", median)
cv2.imshow("bilateral_blur", bilateral_blur)

cv2.waitKey()


在这里插入图片描述

​ 除了以上opencv中自带的函数去除噪点,还可以使用深度学习模型更好的去除噪点。

​ OpenCV本身并不直接提供深度学习去噪的实现,但你可以利用深度学习框架(如TensorFlow、PyTorch等)和预训练的去噪模型(如DnCNN、U-Net等)来进行去噪。下面是一个使用深度学习去噪的简化示例(假设你已经有一个训练好的模型)。

import cv2
import torch
import numpy as np

# 加载训练好的模型 (假设你已经训练了一个去噪模型)
model = torch.load("denoising_model.pth")  # 这是一个假设的模型路径
model.eval()

# 读取图像
image = cv2.imread("plane.jpg")
image_tensor = torch.from_numpy(image).float().unsqueeze(0).unsqueeze(0)  # 转换为 PyTorch Tensor

# 将图像输入模型进行去噪
with torch.no_grad():
    denoised_image_tensor = model(image_tensor)

# 将去噪后的 Tensor 转换回图像格式
denoised_image = denoised_image_tensor.squeeze().numpy().astype(np.uint8)

# 显示原图像和去噪后的图像
cv2.imshow("Original Image", image)
cv2.imshow("Denoised Image (Deep Learning)", denoised_image)

cv2.waitKey(0)
cv2.destroyAllWindows()

总结:

1. 均值滤波:适用于轻度噪声,简单但可能模糊图像细节。

2. 中值滤波:特别适用于去除椒盐噪声,能够保留边缘细节。

3. 高斯滤波:适用于去除高斯噪声,可以有效平滑图像。

4. 双边滤波:去噪的同时能够保留图像边缘,适用于需要保持细节的情况。

5. 深度学习去噪:通常提供最好的去噪效果,尤其适用于复杂的噪声类型,但需要预训练的深度学习模型和计算资源。

可以根据噪声的类型和图像的特性选择合适的去噪方法。

总结:

1. 均值滤波:适用于轻度噪声,简单但可能模糊图像细节。

2. 中值滤波:特别适用于去除椒盐噪声,能够保留边缘细节。

3. 高斯滤波:适用于去除高斯噪声,可以有效平滑图像。

4. 双边滤波:去噪的同时能够保留图像边缘,适用于需要保持细节的情况。

5. 深度学习去噪:通常提供最好的去噪效果,尤其适用于复杂的噪声类型,但需要预训练的深度学习模型和计算资源。

可以根据噪声的类型和图像的特性选择合适的去噪方法。

目前更新到这里,后续会增加。


http://www.kler.cn/a/392851.html

相关文章:

  • HAproxy 详解
  • UVC 输出视频格式修改和windows下数据分析
  • Node.js笔记
  • 学术论文写作丨机器学习与深度学习
  • 【Vue】Vue3.0(十九)Vue 3.0 中一种组件间通信方式-自定义事件
  • idea 解决缓存损坏问题
  • 游戏服务器和普通服务器的区别
  • Shell编程之正则表达式与文本处理器
  • 游程编码 (Run-length Encoding)详细解读
  • 【go从零单排】Logging
  • uniapp中多角色导致tabbar过多的解决方式
  • 基于Python的自然语言处理系列(59):MultiRetrievalQAChain 实现
  • 基于SSM的“汽车销售分析与管理系统”的设计与实现(源码+数据库+文档+PPT)
  • 笔记本电脑定期保养
  • SwiftUI开发教程系列 - 第十二章:本地化与多语言支持
  • 贪心算法入门(二)
  • 【ROS的Navigation导航系统】
  • (附项目源码)Java开发语言,监督管家APP的设计与实现 58,计算机毕设程序开发+文案(LW+PPT)
  • 传奇996_19——常用函数
  • redis 原理篇 30 redis内存回收 过期key处理
  • 前端框架大比拼:React.js, Vue.js 及 Angular 的优势与适用场景探讨
  • linux,源码编译安装、rsync本地同步、rsync远程同步、inotifywaite实时同步、数据库服务基础、邮件的收发
  • LuaRocks如何安装数据库驱动?
  • Dubbo 3.x源码(24)—Dubbo服务引用源码(7)接口级服务发现订阅refreshInterfaceInvoker
  • Database Advantages (数据库系统的优点)
  • HTML文本标签学习记录