当前位置：首页 > article >正文

使用 Python 和 OpenCV 实现摄像头人脸检测并截图

article 2025/2/22 2:13:39

概述

在现代应用中，人脸检测是一项非常重要的技术，广泛应用于安全监控、身份验证等领域。本文将详细介绍如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图，并通过具体的代码示例来展示整个过程。

环境准备

在开始编写代码之前，确保已经安装了 OpenCV 库。可以使用以下命令安装：

pip install opencv-python

代码详解

# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time

# 调用摄像头检测人脸并截图
def camera(window_name, path_name):

    # Linux 不显示图形界面
    cv2.namedWindow(window_name)

    # 视频来源，来自USB摄像头
    cap = cv2.VideoCapture(0)

    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")

    # 识别出人脸后要画的边框的颜色，RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测，1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num + 1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s，不要太频繁的发送，知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()

if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")

代码解析

1. 导入必要的模块

# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time

# -*- coding: utf-8 -*-：指定文件编码为 UTF-8。
import cv2：导入 OpenCV 库，用于图像处理和人脸检测。
import os：导入 os 模块，用于文件路径操作。
import time：导入 time 模块，用于延迟操作。

2. 定义 `camera` 函数

def camera(window_name, path_name):

def camera(window_name, path_name):：定义一个名为 camera 的函数，参数 window_name 是窗口名称，path_name 是保存截图的路径。

3. 创建窗口

    # Linux 不显示图形界面
    cv2.namedWindow(window_name)

cv2.namedWindow(window_name)：创建一个窗口，用于显示视频流。在 Linux 下可以注释掉这行代码以不显示图形界面。

4. 打开摄像头

    # 视频来源，来自USB摄像头
    cap = cv2.VideoCapture(0)

cv2.VideoCapture(0)：打开默认摄像头。参数 0 表示默认摄像头。

5. 加载人脸识别分类器

    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")

cv2.CascadeClassifier(...)：加载预训练的 Haar 级联分类器，用于检测人脸。
os.getcwd()+"/haarcascade_frontalface_alt.xml"：指定分类器文件的路径。

6. 设置边框颜色

    # 识别出人脸后要画的边框的颜色，RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

color = (0, 255, 0)：定义边框颜色为绿色。

7. 主循环

    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测，1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num + 1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s，不要太频繁的发送，知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break

num = 0：初始化计数器。
while cap.isOpened():：进入无限循环，实时读取摄像头图像。
ok, frame = cap.read()：从摄像头读取一帧图像。
if not ok:：检查读取是否成功，如果失败则退出循环。
grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)：将图像转换为灰度图像。
faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))：检测图像中的人脸。
if len(faceRects) > 0:：检查是否检测到人脸。
for faceRect in faceRects:：遍历检测到的每个人脸。
x, y, w, h = faceRect：获取人脸的位置和大小。
num = num + 1：增加计数器。
img_name = "%s/%d.jpg" % (path_name, num)：生成保存图像的文件名。
image = frame[y - 10: y + h + 10, x - 10: x + w + 10]：裁剪人脸区域并扩大边界。
cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])：保存图像。
cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)：在图像上绘制矩形框。
font = cv2.FONT_HERSHEY_SIMPLEX：设置字体样式。
cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)：在图像上显示当前捕捉到的人脸数量。
cv2.imshow(window_name, frame)：显示带有矩形标记的图像。
c = cv2.waitKey(10)：等待 10 毫秒，等待用户按键。
if c & 0xFF == ord('q'):：按 ‘q’ 键退出循环。

8. 释放资源

    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()

cap.release()：释放摄像头资源。
cv2.destroyAllWindows()：关闭所有 OpenCV 窗口。

9. 主程序入口

if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")

if __name__ == '__main__':：检查是否直接运行此脚本。
camera("watchdog", os.getcwd()+"/face")：调用 camera 函数，传入窗口名称和保存截图的路径。

完整代码

# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# 调用摄像头检测人脸并截图
def camera(window_name, path_name):

    # Linux 不显示图形界面
    cv2.namedWindow(window_name)

    # 视频来源，来自USB摄像头
    cap = cv2.VideoCapture(0)

    # 告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")

    # 识别出人脸后要画的边框的颜色，RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

    num = 0
    while cap.isOpened():
        ok, frame = cap.read()  # 读取一帧数据
        if not ok:
            break

        # 将当前桢图像转换成灰度图像
        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 人脸检测，1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
        if len(faceRects) > 0:  # 大于0则检测到人脸
            for faceRect in faceRects:  # 单独框出每一张人脸
                x, y, w, h = faceRect
                num = num+1
                # 将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                # 延迟 60s，不要太频繁的发送，知道来了就可以了
                # time.sleep(60)
                # 画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                # 显示当前捕捉到了多少人脸图片了
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)

        # 显示图像 Linux 下注释掉即可
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break
    # 释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()




if __name__ == '__main__':
    camera("watchdog", os.getcwd()+"/face")

测试

确保你的摄像头正常工作。
运行脚本：
```
python3 face_detection.py
```
打开摄像头后，你会看到一个窗口显示实时视频流，并且在检测到的人脸周围绘制绿色矩形。
按 ‘q’ 键退出程序。

总结

本文详细介绍了如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图，并通过具体的代码示例展示了整个过程。通过使用 cv2.VideoCapture 打开摄像头，cv2.CascadeClassifier 加载预训练的 Haar 级联分类器，cv2.cvtColor 转换图像颜色空间，cv2.rectangle 绘制矩形，cv2.imwrite 保存图像，最终实现了在实时视频流中检测并保存人脸图像的功能。

查看全文

http://www.kler.cn/a/393300.html