当前位置: 首页 > article >正文

【OpenCV1】虚拟环境的使用、opencv的使用、图像和视频的创建和显示

0 虚拟环境的使用
1. 机器视觉介绍
2. OpenCV介绍
3. 安装OpenCV
4. 图像视频的加载和显示
4.1 创建和显示窗口
4.2 加载显示图片
4.3 保存图片
4.4 视频采集
4.5 视频录制
4.6 控制鼠标
4.7 TrackBar控件

0 虚拟环境的使用

1. 安装virtualenv
pip install virtualenv -i https://pypi.douban.com/simple

2. 安装虚拟环境
进入到你想安装虚拟环境的目录, 进入到黑窗口. 执行以下命令产生一个新的虚拟环境

virtualenv <虚拟环境名字>

3. 使用虚拟环境
进入虚拟环境的scripts目录, 在这个目录下进入黑窗口. 执行activate激活虚拟环境.

4. 安装需要的包
进入 虚拟环境之后执行以下命令安装需要的包.
pip install jupyter numpy pandas matplotlib -i https://pypi.douban.com/simple

等待安装完成即可.

启动jupyter

进入虚拟环境之后.在你想启动jupyter的地方,执行jupyter notebook



解决虚拟环境不能正常补全的问题.

进入虚拟环境,执行:
pip install jedi==0.17.0 -i https://pypi.douban.com/simple
pip install parso==0.7.1 -i https://pypi.douban.com/simple
pip install ipython==7.10.0 -i https://pypi.douban.com/simple

1. 机器视觉介绍

现在说的机器视觉(Machine Vision)一般指计算机视觉(Computer Vision), 简单来说就是研究如何使机器看懂东西. 

就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。

1.1 机器视觉的应用

  • 物体识别: 人脸识别, 车辆检测
    请添加图片描述
    请添加图片描述

  • 识别图像中的文字(OCR)
    请添加图片描述

  • 图像拼接, 修复, 背景替换
    请添加图片描述请添加图片描述

2. OpenCV介绍

- Gray Bradsky于1999年开发, 2000年发布

- C++, Python, Java, JS

- 跨平台(Windows, Linux, Mac...)

为什么选择python语言:

- python语言简单, 开发速度快
- 底层使用C/C++, 速度有保障
- 有完整的生态链

目标:
- 了解OpenCV的运行机制
- 可以使用OpenCV处理一些图像常见问题
- 学会物体识别, 文字识别等问题的处理思路

3. 安装OpenCV

进入虚拟环境, 执行`pip install opencv-python==3.4.1.15`, 3.4.2之后有些算法申请了专利,用不了了.

安装opencv扩展包(选装): `pip install opencv-contrib-python==3.4.1.15`

如果装不了去:https://www.lfd.uci.edu/~gohlke/pythonlibs/下载相应的包手动安装.

pip install opencv-python==3.4.1.15 opencv-contrib-python==3.4.1.15 jupyter matplotlib -i **https://pypi.douban.com/simple**

4. 图像视频的加载和显示

4.1 创建和显示窗口

namedWindow() 创建命名窗口
imshow() 显示窗口
destroyAllwindws() 摧毁窗口
resizeWindow() 改变窗口大小
waitKey() 等待用户输入

imread(path): 加载显示图片
imwrite(path, img): 使用imwrite保存图片

cap=cv2.VideoCapture可以捕获摄像头, 用数字来表示不同的设备, 比如0, 1
cap.read() 返回两个值, 第一个为状态值, 读到帧为True, 第二个值为视频帧
cap.release()  释放

createTrackbar(trackbarname, winname, value, count, onChange) 创建TrackBar控件, value为trackbar的默认值, count为bar的最大值, 最小为0
getTrackbarPos(trackbarname, winname) 获取TrackBar当前值

 
  import c2

  # 创建窗口
  # cv2.WINDOW_AUTOSIZE是不允许修改窗口大小的,是固定的
  # WINDOW_NORMAL可以让窗口大小变得可以调节
  cv2.namedWindow('new', cv2.WINDOW_NORMAL)
  # 修改窗口大小
  cv2.resizeWindow('new', 1920, 1080)
  cv2.imshow('new', 0)
  # waitKey方法表示等待按键, 0表示任何按键, 其他整数表示等待按键的时间,单位是毫秒, 超过时间没有发生按键操作窗口会自动关闭.
  # 会返回按键的ascii的值
  key = cv2.waitKey(0)
  if key == ord('q'):
      cv2.destroyAllWindows()

4.2 加载显示图片

  • imread(path, flag): 使用imread可以读取图片, 默认读取的是彩色图片.比如:
  # 导入opencv包
  import cv2
  import matplotlib.pyplot as plt
  import numpy as np
  
  # 读取图片
  img = cv2.imread('./cat.jpeg')
  • 原图长这样:
    请添加图片描述

    使用matplotlib显示plt.imshow(img), 长这样:
    请添加图片描述

    发现这个猫的样子没变, 但是颜色不太对, 这是因为OpenCV读取的图片颜色通道是按照BGR(蓝绿红)排列的, 一般图片通道都是按照RGB来排列的.为了正常的显示猫的图片, 我们要用OpenCV的图像显示方法:

  cv2.imshow('cat', img)
  cv2.waitKey(0)
  cv2.destroyAllWindows()

我们可以把显示图片的方法封装成一个函数方便我们显示图片:

  def cv_show(name, img):
      cv2.imshow(name, img)
      cv2.waitKey(0)
      cv2.destroyAllWindows()

4.3 保存图片

  • imwrite(path, img): 使用imwrite保存图片.
  import cv2

#  创建窗口
cv2.namedWindow('img', cv2.WINDOW_NORMAL)
# 设置窗口大小
cv2.resizeWindow('img', 320, 680)

# 读取图片
img = cv2.imread('./cat.jpeg')

while True:
    # 展示图片
    cv2.imshow('img', img)
    # 等待用户输入关闭窗口
    key = cv2.waitKey(0)
    if (key & 0xFF == ord('q')):
        break
    elif (key & 0xFF == ord('s')):
        cv2.imwrite('./123.png', img)
    else:
        print(key)

# 销毁窗口
cv2.destroyAllWindows()
  

4.4 视频采集

  • 视频是由图片组成的, 视频的每一帧就是一幅图片, 一般是30帧, 表示一秒显示30张图片.
  • cv2.VideoCapture可以捕获摄像头, 用数字来表示不同的设备, 比如0, 1
  • 如果是视频文件, 可以直接指定路径即可.
# 打开视频文件
vc = cv2.VideoCapture('./1.mp4')

# 打开摄像头
vc = cv2.VideoCapture(0)
  • 检查是否正确打开
  if vc.isOpened():
      # 读取视频的一帧.
      open, frame = vc.read()
  else:
      open = False
  • 循环读取视频每一帧数据
 while True:
      # 可以读到内容ret返回True
      ret, frame = vc.read()
      # 读到最后frame就是空
      if frame is None:
          break
      if ret == True:
          cv2.imshow('result', gray)
          # 0xFF == 27表示按esc退出键会退出
          if cv2.waitKey(33) & 0xFF == 27:
              break
  vc.release()
  cv2.destroyAllWindows()
  • cap.read() 返回两个值, 第一个为状态值, 读到帧为True, 第二个值为视频帧

  • cap.release()

  • 循环读取摄像头的每一帧数据

import cv2

# 创建一个名为 'video' 的窗口,窗口类型设置为可调整大小
cv2.namedWindow('video', cv2.WINDOW_NORMAL)

# 将窗口的初始大小设置为 640x480 像素
cv2.resizeWindow('video', 640, 480)

# 打开视频文件 './1.mp4' 作为视频源
# 如果要使用摄像头作为输入,使用 cap = cv2.VideoCapture(0)
cap = cv2.VideoCapture('./1.mp4')

# 循环读取视频的每一帧
while True:
    # 从视频源中读取一帧数据
    # ret 是布尔值,表示帧是否成功读取,frame 是当前帧图像
    ret, frame = cap.read() 
    if not ret:  # 如果未成功读取到帧(例如视频播放完毕或出错),则退出循环
        break
    
    # 在名为 'video' 的窗口中显示当前帧
    cv2.imshow('video', frame)

    # 等待 10 毫秒,检测键盘输入
    # waitKey 返回按下键的 ASCII 值,10 表示等待 10 毫秒
    key = cv2.waitKey(10)
    if key == ord('q'):  # 如果按下 'q' 键,退出循环
        break

# 释放视频源资源(例如关闭摄像头或视频文件)
cap.release()

# 销毁所有由 OpenCV 创建的窗口
cv2.destroyAllWindows()


4.5 视频录制

  • VideoWriter : 参数一为输出文件, 参数二为多媒体文件格式(VideoWriter_fourcc, 参数三为帧率, 参数四为分辨率.
  • write 编码并写入缓存
  • release 缓存内容写入磁盘, 并释放资源
import cv2

# 打开默认摄像头(索引为 0)
cap = cv2.VideoCapture(0)

# 定义视频编解码器,用于将帧压缩并保存为视频文件
# 'mp4v' 是一种常见的 MPEG-4 视频编码器
# *'mp4v' 是解包操作,相当于传递 'm', 'p', '4', 'v' 四个字符
fourcc = cv2.VideoWriter_fourcc(*'mp4v')

# 创建 VideoWriter 对象,保存录制的视频
# 参数说明:'output.mp4' 是保存的视频文件名,fourcc 是视频编码器,
# 20 表示帧率为 20 FPS,(640, 480)是视频的分辨率
# vw = cv2.VideoWriter('output.mp4', fourcc, 20, (640, 480))
vw = cv2.VideoWriter('output.avi', fourcc, 20, (640, 480))

# 使用 cap.isOpened() 检查摄像头是否已经成功打开
while cap.isOpened():
    # 从摄像头读取一帧数据
    ret, frame = cap.read()
    if not ret:  # 如果读取帧失败,打印错误信息并退出循环
        print('Cannot receive frame, Exiting...')
        break
    
    # 将当前帧写入到视频文件中
    vw.write(frame)
    
    # 在窗口中显示当前帧
    cv2.imshow('frame', frame)

    # 等待 1 毫秒检测键盘输入,如果按下 'q' 键,则退出循环
    if cv2.waitKey(1) == ord('q'):
        break

# 释放摄像头资源
cap.release()

# 释放 VideoWriter 对象资源,关闭视频文件
vw.release()

# 关闭所有 OpenCV 窗口
cv2.destroyAllWindows()

4.6 控制鼠标

OpenCV允许我们对窗口上的鼠标动作做出响应.

  • setMouseCallback(winname, callback, userdata) winname是窗口的名字, callback是回调函数, userdata是给回调函数的参数.

  • callback(event, x, y, flags, userdata)回调函数必须包含这5个参数. event是事件(鼠标移动, 左键, 右键等), x,y是点鼠标的坐标点, flags主要用于组合键, userdata就是上面的setMouseCallback的userdata

  • 鼠标事件:

    • EVENT_MOUSEMOVE 0 鼠标移动
    • EVENT_LBUTTONDOWN 1 按下鼠标左键
    • EVENT_RBUTTONDOWN 2 按下鼠标右键
    • EVENT_MBUTTONDOWN 3 按下鼠标中键
    • EVENT_LBUTTONUP 4 左键释放
    • EVENT_RBUTTONUP 5 右键释放
    • EVENT_MBUTTONUP 6 中键释放
    • EVENT_LBUTTONDBLCLK 7 左键双击
    • EVENT_RBUTTONDBLCLK 8 右键双击
    • EVENT_MBUTTONDBLCLK 9 中键双击
    • EVENT_MOUSEWHEEL 10 鼠标滚轮上下滚动
    • EVENT_MOUSEHWHEEL 11 鼠标左右滚动
  • flags:

    • EVENT_FLAG_LBUTTON 1 按下左键
    • EVENT_FLAG_RBUTTON 2 按下右键
    • EVENT_FLAG_MBUTTON 4 按下中键
    • EVENT_FLAG_CRTLKEY 8 按下ctrl键
    • EVENT_FLAG_SHIFTKEY 16 按下shift键
    • EVENT_FLAG_ALTKEY 32 按下alt键
import cv2
import numpy as np

# 定义鼠标事件回调函数
def mouse_callback(event, x, y, flags, userdata):
    """
    鼠标事件的回调函数。
    
    :param event: 鼠标事件的代号,例如左键按下、移动、抬起等。
    :param x: 鼠标当前位置的 x 坐标。
    :param y: 鼠标当前位置的 y 坐标。
    :param flags: 鼠标事件触发时的特殊按键(如 Ctrl、Shift)状态。
    :param userdata: 用户传入的额外参数,在这里是字符串 '123'。
    """
    # 打印事件信息,包括事件类型、鼠标坐标、标志位和用户数据
    print(event, x, y, flags, userdata)
    
    # 如果鼠标事件是双击 (event == 2, 即左键双击事件)
    if event == cv2.EVENT_LBUTTONDBLCLK:
        # 销毁所有 OpenCV 创建的窗口并退出
        cv2.destroyAllWindows()

# 创建一个名为 'mouse' 的窗口,并设置为可调整大小的类型
cv2.namedWindow('mouse', cv2.WINDOW_NORMAL)

# 设置窗口的初始大小为 640x480 像素
cv2.resizeWindow('mouse', 640, 480)

# 设置鼠标回调函数,当鼠标在 'mouse' 窗口中发生事件时调用 mouse_callback 函数
# '123' 是传递给回调函数的用户数据
cv2.setMouseCallback('mouse', mouse_callback, '123')

# 创建一张全黑的图片,大小为 480x640,3 通道(彩色),每个像素值为 0(黑色)
img = np.zeros((480, 640, 3), np.uint8)

# 无限循环,直到用户按下退出键
while True:
    # 在 'mouse' 窗口中显示全黑的图像
    cv2.imshow('mouse', img)
    
    # 每 1 毫秒检测一次键盘输入
    key = cv2.waitKey(1)
    
    # 如果按下 'q' 键,退出循环
    if key == ord('q'):
        break

# 退出循环后,销毁所有 OpenCV 创建的窗口
cv2.destroyAllWindows()

4.7 TrackBar控件

TrackBar控件

请添加图片描述

  • createTrackbar(trackbarname, winname, value, count, onChange) 创建TrackBar控件, value为trackbar的默认值, count为bar的最大值, 最小为0
  • getTrackbarPos(trackbarname, winname) 获取TrackBar当前值
import cv2
import numpy as np

# 创建一个名为 'trackbar' 的窗口,并设置为可调整大小
cv2.namedWindow('trackbar', cv2.WINDOW_NORMAL)

# 调整窗口大小为 640x480
cv2.resizeWindow('trackbar', 640, 480)

# 定义 Trackbar 的回调函数,当 Trackbar 的值发生变化时会被调用
def callback(value):
    """
    Trackbar 回调函数,用于响应 Trackbar 值变化时的操作。
    
    :param value: 当前 Trackbar 的值。
    """
    print(value)  # 打印当前 Trackbar 的值

# 创建三个 Trackbar,分别控制 R、G、B 三个颜色通道的值,初始值为 0,最大值为 255
# Trackbar 的名字为 'R', 'G', 'B',绑定的窗口为 'trackbar',初始值设为 0,最大值为 255,回调函数为 callback
cv2.createTrackbar('R', 'trackbar', 0, 255, callback)
cv2.createTrackbar('G', 'trackbar', 0, 255, callback)
cv2.createTrackbar('B', 'trackbar', 0, 255, callback)

# 创建一个 480x640 的黑色背景图片,3 通道表示彩色图片
img = np.zeros((480, 640, 3), np.uint8)

# 无限循环,直到用户按下退出键
while True:
    # 获取 'R', 'G', 'B' 三个 Trackbar 当前的值
    r = cv2.getTrackbarPos('R', 'trackbar')
    g = cv2.getTrackbarPos('G', 'trackbar')
    b = cv2.getTrackbarPos('B', 'trackbar')
    
    # 将背景图片的所有像素值设置为 [b, g, r],即用当前 Trackbar 值作为图像颜色
    img[:] = [b, g, r]
    
    # 在 'trackbar' 窗口中显示更新后的图片
    cv2.imshow('trackbar', img)
    
    # 每 1 毫秒检测一次键盘输入,按下 'q' 键退出循环
    key = cv2.waitKey(1)
    if key & 0xFF == ord('q'):
        break

# 退出循环后,销毁所有 OpenCV 创建的窗口
cv2.destroyAllWindows()


http://www.kler.cn/news/293487.html

相关文章:

  • 政府招商引资管理数字化平台:渠道、意向客户、项目管理、招商载体、绩效一体化管理平台
  • Spring MVC思想 实践开发 核心组件 流程分析
  • 【go-zero】win启动rpc服务报错 panic: context deadline exceeded
  • 设计模式学习-命令模式
  • HTTP 方法
  • Redis 的内存淘汰策略详解
  • 电机驱动及编码器测速(基于STM32F103C8T6HAL库)
  • ARM32开发——GD32F4 DMA功能查询
  • windows手工杀毒-寻找可疑进程之线程
  • 如何在Selenium中使用Chrome DevTools进行交互
  • python的sqlalchemy使用@contextmanager来定义上下文管理器
  • shell脚本编程(正则表达式与grep +awk+sed+expect详解)
  • OpenCV中的颜色映射函数
  • [pytorch] --- pytorch基础之损失函数与反向传播
  • VUE3父子组件传参
  • Requests库对session的支持
  • PHP 项目流水线部署与错误问题解决
  • U盘数据危机应对:详解文件或目录损坏无法读取的恢复之道
  • SpringMVC启动与请求处理流程解析
  • 将网页保存为PDF---不分页
  • GIT | git提交注释自动添加信息头
  • echarts动态切换数据渲染(vue3 + echarts)
  • 5G移动网络运维实验(训)室解决方案
  • 逻辑回归与线性回归的目标函数和应用场景比较
  • 坐牢第三十六天(QT)
  • iOS——Block与内存管理
  • Kafka 实战演练:创建、配置与测试 Kafka全面教程
  • 《Python爬虫逆向实战》加密方法远程调用(RPC)
  • TRIZ在充电桩安全中的应用探究
  • Java 入门指南:Java 并发编程 —— Fork/Join 框架 实现任务的拆分与合并