当前位置: 首页 > article >正文

STGCN+YOLOV8 端到端 视频行为分类训练与测试

摘要:

本文介绍了使用STGCN(时空图卷积网络)进行视频行为分类的流程。首先,利用YOLOv8网络在KTH数据集(可以是自定义数据集)上进行姿态估计,获取2D关节点数据。随后,将关节点数据转换为STGCN模型所需的kinectics格式。接着,根据实验需求调整STGCN模型的相关参数,进行模型的训练和测试。在训练阶段,模型学习动作特征;在测试阶段,评估模型性能。最后,通过可视化演示展示了模型在视频行为分类任务中的应用效果。整个过程涵盖了从数据获取、处理到模型训练、测试及应用的完整流程,为视频行为分类任务提供了一种有效的解决方案。

环境要求

python == 3.7.16

torch + cu116 == 1.13.1

torchaudio + cu116 == 0.13.1

torchvision + cu116 == 0.14.1

ultralytics == 8.0.145

stgcn

目录

环境要求

一、关节点骨架数据

1、yolov8姿态估计获取关节点数据

2、stgcn关节点数据格式处理

3、stgcn训练集和测试集数据标签汇总

二、基于stgcn的行为分类

1、相关文件代码修改

(1)修改label_name.txt

(2)增加layout

(3)修改train.yaml

2、stgcn模型训练

3、stgcn模型测试 

4、demo可视化演示

(1)修改/tools/utils/video.py

(2)修改main.py,增加demo_kth

(3)新建./config/st_gcn/kth/demo_kth.yaml文件 

(4)新建./processor/demo_kth.py文件(参考demo_old.py文件)

(5)终端运行命令


http://www.kler.cn/a/387217.html

相关文章:

  • (01)FreeRTOS移植到STM32
  • 【Linux】进程间通信IPC
  • Redis--21--大Key问题解决方案
  • AI 编程工具—Cursor进阶使用 阅读开源项目
  • 【NLP】语言模型的发展历程 (1)
  • 《数据思维》之数据可视化_读书笔记
  • huggingface 下载方法 测试ok
  • es自动补全(仅供自己参考)
  • 【含开题报告+文档+PPT+源码】基于Springboot和vue的电影售票系统
  • 3. Redis的通用命令介绍
  • 使用 React Native WebView 实现 App 与 Web 的通讯
  • Python 爬虫使用 BeautifulSoup 进行 XPath 和 CSS 选择器定位
  • 3.3 软件需求:面对对象分析模型
  • 三周精通FastAPI:33 在编辑器中调试
  • 性能调优概念和目标
  • 破解数字化转型中的常见挑战:企业架构蓝图实施的关键策略与实用方案
  • Ubuntu 24.04 无边框
  • iOS SmartCodable 替换 HandyJSON 适配记录
  • 使用Python实现智能食品供应链管理的深度学习模型
  • oracle数据坏块处理(二)-逻辑坏块重新格式化处理
  • CUDA系统学习之一软件堆栈架构
  • 初试Lisp语言
  • 【大数据学习 | HBASE】hbase shell基础实操
  • Go语言面向对象编程
  • 【GESP】C++一级真题练习(202312)luogu-B3921,小杨的考试
  • mysql的高级进阶