当前位置: 首页 > article >正文

使用 Python 和 OpenCV 实现摄像头人脸检测并截图

概述

在现代应用中,人脸检测是一项非常重要的技术,广泛应用于安全监控、身份验证等领域。本文将详细介绍如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例来展示整个过程。

环境准备

在开始编写代码之前,确保已经安装了 OpenCV 库。可以使用以下命令安装:

pip install opencv-python
代码详解
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time

# 调用摄像头检测人脸并截图
def camera(window_name, path_name):

    # Linux 不显示图形界面
    cv2.namedWindow(window_name)

    # 视频来源,来自USB摄像头
    cap = cv2.VideoCapture(0)

    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")

    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num + 1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s,不要太频繁的发送,知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()

if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")
代码解析
1. 导入必要的模块
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
  • # -*- coding: utf-8 -*-:指定文件编码为 UTF-8。
  • import cv2:导入 OpenCV 库,用于图像处理和人脸检测。
  • import os:导入 os 模块,用于文件路径操作。
  • import time:导入 time 模块,用于延迟操作。
2. 定义 camera 函数
def camera(window_name, path_name):
  • def camera(window_name, path_name)::定义一个名为 camera 的函数,参数 window_name 是窗口名称,path_name 是保存截图的路径。
3. 创建窗口
    # Linux 不显示图形界面
    cv2.namedWindow(window_name)
  • cv2.namedWindow(window_name):创建一个窗口,用于显示视频流。在 Linux 下可以注释掉这行代码以不显示图形界面。
4. 打开摄像头
    # 视频来源,来自USB摄像头
    cap = cv2.VideoCapture(0)
  • cv2.VideoCapture(0):打开默认摄像头。参数 0 表示默认摄像头。
5. 加载人脸识别分类器
    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")
  • cv2.CascadeClassifier(...):加载预训练的 Haar 级联分类器,用于检测人脸。
  • os.getcwd()+"/haarcascade_frontalface_alt.xml":指定分类器文件的路径。
6. 设置边框颜色
    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)
  • color = (0, 255, 0):定义边框颜色为绿色。
7. 主循环
    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num + 1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s,不要太频繁的发送,知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
  • num = 0:初始化计数器。
  • while cap.isOpened()::进入无限循环,实时读取摄像头图像。
  • ok, frame = cap.read():从摄像头读取一帧图像。
  • if not ok::检查读取是否成功,如果失败则退出循环。
  • grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY):将图像转换为灰度图像。
  • faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32)):检测图像中的人脸。
  • if len(faceRects) > 0::检查是否检测到人脸。
  • for faceRect in faceRects::遍历检测到的每个人脸。
  • x, y, w, h = faceRect:获取人脸的位置和大小。
  • num = num + 1:增加计数器。
  • img_name = "%s/%d.jpg" % (path_name, num):生成保存图像的文件名。
  • image = frame[y - 10: y + h + 10, x - 10: x + w + 10]:裁剪人脸区域并扩大边界。
  • cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9]):保存图像。
  • cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2):在图像上绘制矩形框。
  • font = cv2.FONT_HERSHEY_SIMPLEX:设置字体样式。
  • cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4):在图像上显示当前捕捉到的人脸数量。
  • cv2.imshow(window_name, frame):显示带有矩形标记的图像。
  • c = cv2.waitKey(10):等待 10 毫秒,等待用户按键。
  • if c & 0xFF == ord('q')::按 ‘q’ 键退出循环。
8. 释放资源
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()
  • cap.release():释放摄像头资源。
  • cv2.destroyAllWindows():关闭所有 OpenCV 窗口。
9. 主程序入口
if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")
  • if __name__ == '__main__'::检查是否直接运行此脚本。
  • camera("watchdog", os.getcwd()+"/face"):调用 camera 函数,传入窗口名称和保存截图的路径。
完整代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# 调用摄像头检测人脸并截图
def camera(window_name, path_name):

    # Linux 不显示图形界面
    cv2.namedWindow(window_name)

    # 视频来源,来自USB摄像头
    cap = cv2.VideoCapture(0)

    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")

    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num+1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s,不要太频繁的发送,知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()




if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")


测试
  1. 确保你的摄像头正常工作。

  2. 运行脚本:

    python3 face_detection.py
    
  3. 打开摄像头后,你会看到一个窗口显示实时视频流,并且在检测到的人脸周围绘制绿色矩形。

  4. 按 ‘q’ 键退出程序。

总结

本文详细介绍了如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例展示了整个过程。通过使用 cv2.VideoCapture 打开摄像头,cv2.CascadeClassifier 加载预训练的 Haar 级联分类器,cv2.cvtColor 转换图像颜色空间,cv2.rectangle 绘制矩形,cv2.imwrite 保存图像,最终实现了在实时视频流中检测并保存人脸图像的功能。



http://www.kler.cn/a/393300.html

相关文章:

  • 【计算机网络】UDP网络程序
  • 除了 Mock.js,前端还有更方便的 Mock 数据工具吗?
  • ubuntu20.04安装FLIR灰点相机BFS-PGE-16S2C-CS的ROS驱动
  • 【深圳大学】数据结构A+攻略(计软版)
  • fastapi 查询参数支持 Pydantic Model:参数校验与配置技巧
  • uniapp 设置安全区域
  • 什么是RabbitMQ?
  • 搭建Python2和Python3虚拟环境
  • MySQL --- 自定义函数获取部门层级名称
  • 修改mysql默认字符集
  • C语言最简单的扫雷实现(解析加原码)
  • 各版本android studio下载地址
  • Vue slot 插槽 v-slot属性具名插槽
  • 足球社区管理系统 基于Spring Boot框架实现的足球社区管理系统(程序+数据库+报告)
  • 当kafka消费的数据滞后1000条时,打印告警信息
  • 在 Jupyter Notebook 中使用 Matplotlib 进行交互式可视化的教程
  • 第23节 arkts 如何实现多语言
  • 蓝桥杯每日真题 - 第7天
  • 重构代码之移动字段
  • AutoSAR CP DoIP规范导读
  • 网页直播/点播播放器EasyPlayer.js无插件H5播放器关于其后地址不带协议后缀的判断逻辑
  • 方法论-利益驱动模型与系列选择模型(说服他人)
  • acwing算法基础02一高精度,前缀和,差分
  • 引入第三方jar包部署服务器后找不到jar处理方法
  • Ansible剧本检测Windows防火墙状态
  • Redis - 哨兵(Sentinel)