使用 Python 和 OpenCV 实现摄像头人脸检测并截图
概述
在现代应用中,人脸检测是一项非常重要的技术,广泛应用于安全监控、身份验证等领域。本文将详细介绍如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例来展示整个过程。
环境准备
在开始编写代码之前,确保已经安装了 OpenCV 库。可以使用以下命令安装:
pip install opencv-python
代码详解
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# 调用摄像头检测人脸并截图
def camera(window_name, path_name):
# Linux 不显示图形界面
cv2.namedWindow(window_name)
# 视频来源,来自USB摄像头
cap = cv2.VideoCapture(0)
# 告诉OpenCV使用人脸识别分类器
classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")
# 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
color = (0, 255, 0)
num = 0
while cap.isOpened():
ok, frame = cap.read() # 读取一帧数据
if not ok:
break
# 将当前桢图像转换成灰度图像
grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
if len(faceRects) > 0: # 大于0则检测到人脸
for faceRect in faceRects: # 单独框出每一张人脸
x, y, w, h = faceRect
num = num + 1
# 将当前帧保存为图片
img_name = "%s/%d.jpg" % (path_name, num)
image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])
# 延迟 60s,不要太频繁的发送,知道来了就可以了
# time.sleep(60)
# 画出矩形框
cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
# 显示当前捕捉到了多少人脸图片了
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)
# 显示图像 Linux 下注释掉即可
cv2.imshow(window_name, frame)
c = cv2.waitKey(10)
if c & 0xFF == ord('q'):
break
# 释放摄像头并销毁所有窗口
cap.release()
cv2.destroyAllWindows()
if __name__ == '__main__':
camera("watchdog", os.getcwd()+"/face")
代码解析
1. 导入必要的模块
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# -*- coding: utf-8 -*-
:指定文件编码为 UTF-8。import cv2
:导入 OpenCV 库,用于图像处理和人脸检测。import os
:导入 os 模块,用于文件路径操作。import time
:导入 time 模块,用于延迟操作。
2. 定义 camera
函数
def camera(window_name, path_name):
def camera(window_name, path_name):
:定义一个名为camera
的函数,参数window_name
是窗口名称,path_name
是保存截图的路径。
3. 创建窗口
# Linux 不显示图形界面
cv2.namedWindow(window_name)
cv2.namedWindow(window_name)
:创建一个窗口,用于显示视频流。在 Linux 下可以注释掉这行代码以不显示图形界面。
4. 打开摄像头
# 视频来源,来自USB摄像头
cap = cv2.VideoCapture(0)
cv2.VideoCapture(0)
:打开默认摄像头。参数 0 表示默认摄像头。
5. 加载人脸识别分类器
# 告诉OpenCV使用人脸识别分类器
classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")
cv2.CascadeClassifier(...)
:加载预训练的 Haar 级联分类器,用于检测人脸。os.getcwd()+"/haarcascade_frontalface_alt.xml"
:指定分类器文件的路径。
6. 设置边框颜色
# 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
color = (0, 255, 0)
color = (0, 255, 0)
:定义边框颜色为绿色。
7. 主循环
num = 0
while cap.isOpened():
ok, frame = cap.read() # 读取一帧数据
if not ok:
break
# 将当前桢图像转换成灰度图像
grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
if len(faceRects) > 0: # 大于0则检测到人脸
for faceRect in faceRects: # 单独框出每一张人脸
x, y, w, h = faceRect
num = num + 1
# 将当前帧保存为图片
img_name = "%s/%d.jpg" % (path_name, num)
image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])
# 延迟 60s,不要太频繁的发送,知道来了就可以了
# time.sleep(60)
# 画出矩形框
cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
# 显示当前捕捉到了多少人脸图片了
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)
# 显示图像 Linux 下注释掉即可
cv2.imshow(window_name, frame)
c = cv2.waitKey(10)
if c & 0xFF == ord('q'):
break
num = 0
:初始化计数器。while cap.isOpened():
:进入无限循环,实时读取摄像头图像。ok, frame = cap.read()
:从摄像头读取一帧图像。if not ok:
:检查读取是否成功,如果失败则退出循环。grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
:将图像转换为灰度图像。faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
:检测图像中的人脸。if len(faceRects) > 0:
:检查是否检测到人脸。for faceRect in faceRects:
:遍历检测到的每个人脸。x, y, w, h = faceRect
:获取人脸的位置和大小。num = num + 1
:增加计数器。img_name = "%s/%d.jpg" % (path_name, num)
:生成保存图像的文件名。image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
:裁剪人脸区域并扩大边界。cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])
:保存图像。cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
:在图像上绘制矩形框。font = cv2.FONT_HERSHEY_SIMPLEX
:设置字体样式。cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)
:在图像上显示当前捕捉到的人脸数量。cv2.imshow(window_name, frame)
:显示带有矩形标记的图像。c = cv2.waitKey(10)
:等待 10 毫秒,等待用户按键。if c & 0xFF == ord('q'):
:按 ‘q’ 键退出循环。
8. 释放资源
# 释放摄像头并销毁所有窗口
cap.release()
cv2.destroyAllWindows()
cap.release()
:释放摄像头资源。cv2.destroyAllWindows()
:关闭所有 OpenCV 窗口。
9. 主程序入口
if __name__ == '__main__':
camera("watchdog", os.getcwd()+"/face")
if __name__ == '__main__':
:检查是否直接运行此脚本。camera("watchdog", os.getcwd()+"/face")
:调用camera
函数,传入窗口名称和保存截图的路径。
完整代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# 调用摄像头检测人脸并截图
def camera(window_name, path_name):
# Linux 不显示图形界面
cv2.namedWindow(window_name)
# 视频来源,来自USB摄像头
cap = cv2.VideoCapture(0)
# 告诉OpenCV使用人脸识别分类器
classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")
# 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组
color = (0, 255, 0)
num = 0
while cap.isOpened():
ok, frame = cap.read() # 读取一帧数据
if not ok:
break
# 将当前桢图像转换成灰度图像
grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数
faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))
if len(faceRects) > 0: # 大于0则检测到人脸
for faceRect in faceRects: # 单独框出每一张人脸
x, y, w, h = faceRect
num = num+1
# 将当前帧保存为图片
img_name = "%s/%d.jpg" % (path_name, num)
image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])
# 延迟 60s,不要太频繁的发送,知道来了就可以了
# time.sleep(60)
# 画出矩形框
cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
# 显示当前捕捉到了多少人脸图片了
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)
# 显示图像 Linux 下注释掉即可
cv2.imshow(window_name, frame)
c = cv2.waitKey(10)
if c & 0xFF == ord('q'):
break
# 释放摄像头并销毁所有窗口
cap.release()
cv2.destroyAllWindows()
if __name__ == '__main__':
camera("watchdog", os.getcwd()+"/face")
测试
-
确保你的摄像头正常工作。
-
运行脚本:
python3 face_detection.py
-
打开摄像头后,你会看到一个窗口显示实时视频流,并且在检测到的人脸周围绘制绿色矩形。
-
按 ‘q’ 键退出程序。
总结
本文详细介绍了如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例展示了整个过程。通过使用 cv2.VideoCapture
打开摄像头,cv2.CascadeClassifier
加载预训练的 Haar 级联分类器,cv2.cvtColor
转换图像颜色空间,cv2.rectangle
绘制矩形,cv2.imwrite
保存图像,最终实现了在实时视频流中检测并保存人脸图像的功能。