当前位置: 首页 > article >正文

使用OpenCV和MediaPipe库——实现人体姿态检测

目录

准备工作如何在Windows系统中安装OpenCV和MediaPipe库?

安装Python

安装OpenCV

安装MediaPipe

验证安装

代码逻辑

整体代码

效果展示


准备工作如何在Windows系统中安装OpenCV和MediaPipe库?

安装Python

    可以通过命令行运行python --version来检查版本号。如果没有安装,可以从Python官方网站下载并安装。

安装OpenCV

  1. 打开命令提示符(Command Prompt)。

  2. 输入以下命令来安装OpenCV-python:

    pip install opencv-python

    如果你也需要OpenCV的额外模块(如SIFT、SURF等),可以运行:

    pip install opencv-contrib-python

安装MediaPipe

安装MediaPipe同样简单,只需要在命令提示符下运行:

pip install mediapipe

验证安装

为了验证OpenCV和MediaPipe是否成功安装,可以在命令提示符中启动Python解释器,然后尝试导入这两个库:

import cv2
import mediapipe as mp
print(cv2.__version__)
print(mp.__version__)

如果打印出了版本号,安装成功。


代码逻辑

  1. 导入必要的库:

    • cv2: OpenCV库,用于处理图像和视频。
    • mediapipe as mp: MediaPipe库,提供了一种简单的方法来访问先进的机器学习模型,这里用于人体姿态估计。
    • time: 用于时间相关的操作,比如计算FPS。
  2. 初始化MediaPipe姿势检测对象:

    • 使用mp_pose.Pose()创建了一个姿势检测器对象,设置了最小检测置信度和跟踪置信度为0.5。
  3. 打开摄像头获取视频流:

    • 使用cv2.VideoCapture(0)打开默认摄像头。
  4. 主循环开始:

    • while cap.isOpened():循环中不断读取摄像头数据。
  5. 处理每一帧图像:

    • 首先检查是否成功读取图像。
    • 然后计算当前帧的FPS。
    • 将BGR格式的图像转换为RGB格式,因为MediaPipe需要RGB格式的输入。
    • 使用姿势检测器对象对图像进行处理,得到关键点位置。
  6. 绘制关键点和连接线:

    • 如果检测到了关键点(results.pose_landmarks),则使用mp_drawing.draw_landmarks()函数在图像上绘制这些关键点及其连接线。
    • 可以自定义关键点和连线的颜色、粗细等属性。
  7. 显示FPS信息:

    • 在图像上显示当前帧的FPS值,帮助用户了解程序运行的流畅度。
  8. 展示结果并监听退出指令:

    • 使用cv2.imshow()展示处理后的图像。
    • 监听键盘事件,当按下'q'键时退出循环,释放资源并关闭所有窗口。


整体代码

import cv2  # 导入 OpenCV 库,用于图像处理和显示
import mediapipe as mp  # 导入 MediaPipe 库,用于姿势检测
import time  # 导入时间模块,用于计算 FPS

# 初始化 MediaPipe 的绘图工具和姿势检测模型
mp_drawing = mp.solutions.drawing_utils  # 用于绘制关键点和连接线
mp_pose = mp.solutions.pose  # 用于姿势检测

# 打开摄像头
cap = cv2.VideoCapture(0)  # 0 表示默认摄像头,如果有多个摄像头可以尝试 1, 2, 等

# 初始化 FPS 计算相关变量
prev_time = 0  # 用于存储上一帧的时间戳

# 使用 MediaPipe 的姿势检测模型
with mp_pose.Pose(
    min_detection_confidence=0.5,  # 检测置信度阈值,高于此值才认为检测到姿势
    min_tracking_confidence=0.5    # 跟踪置信度阈值,高于此值才继续跟踪
) as pose:
    # 进入主循环,持续读取摄像头画面
    while cap.isOpened():
        success, image = cap.read()  # 读取一帧画面
        if not success:  # 如果读取失败(如摄像头断开)
            print("无法读取摄像头画面。")
            break

        # --- 计算 FPS ---
        curr_time = time.time()  # 获取当前帧的时间戳
        dt = curr_time - prev_time  # 计算与上一帧的时间间隔(秒)
        fps = 1 / dt if dt != 0 else 0  # 计算帧率(FPS),避免除以零错误
        prev_time = curr_time  # 更新上一帧的时间戳

        # 将图像从 BGR 格式转换为 RGB 格式(MediaPipe 需要 RGB 格式)
        image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

        # 使用姿势检测模型处理图像
        results = pose.process(image_rgb)

        # 如果检测到姿势关键点,绘制关键点和连接线
        if results.pose_landmarks:
            mp_drawing.draw_landmarks(
                image,  # 要绘制的图像
                results.pose_landmarks,  # 检测到的姿势关键点
                mp_pose.POSE_CONNECTIONS,  # 定义关键点之间的连接线
                landmark_drawing_spec=mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2),  # 关键点的颜色和粗细
                connection_drawing_spec=mp_drawing.DrawingSpec(color=(0, 0, 255), thickness=2)  # 连接线的颜色和粗细
            )

        # --- 在画面上显示 FPS ---
        fps_text = "FPS: {:.2f}".format(fps)  # 格式化 FPS 值,保留两位小数
        cv2.putText(
            image,  # 要绘制的图像
            fps_text,  # 显示的文本内容
            (10, 30),  # 文本位置(左上角,距离左边 10 像素,距离顶部 30 像素)
            cv2.FONT_HERSHEY_SIMPLEX,  # 字体类型
            1,  # 字体大小
            (0, 255, 0),  # 字体颜色(绿色)
            2  # 字体粗细
        )

        # 显示处理后的图像
        cv2.imshow('Real-Time Pose Detection', image)

        # 检测按键输入,如果按下 'q' 键则退出循环
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

# 释放摄像头资源
cap.release()

# 关闭所有 OpenCV 窗口
cv2.destroyAllWindows()

效果展示

 


http://www.kler.cn/a/578950.html

相关文章:

  • 论文阅读方法
  • 2008-2024年中国手机基站数据/中国移动通信基站数据
  • GHCTF2025--Web
  • Windows软件插件-音视频文件读取器
  • 稚晖君级硬核:智元公司开源机器人通信框架AimRT入驻GitCode平台
  • Word2Vec向量化语句的计算原理
  • Guava Cache 中LocalCache的分段锁实现
  • UV,纹理,材质,对象
  • electron的通信方式(三种)
  • 健康养生:为生活注入活力
  • 深度链接技术解析:openinstall如何通过场景还原优化用户体验?
  • 【已解决】error setting certificate verify locations
  • 用套接字在网络中传送对象的时候为什么需要序列化?
  • Mac安装jdk教程
  • 深入探讨 Docker 层次结构及其备份策略20250309
  • 《基于Selenium的网页聊天室自动化测试实战报告》
  • android flow中collect和collectLatest的区别
  • [Kubernetes] 7控制平面组件
  • Django ORM 中的 RelatedManager 特殊方法
  • TypeScript系列06-模块系统与命名空间