当前位置: 首页 > article >正文

emotion2vec语音情感识别 - python 实现

emotion2vec语音情感识别。

该模型准确性有待提高。

脚本具体实现如下:

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
import os
import shutil
inference_pipeline = pipeline(
    task=Tasks.emotion_recognition,
    model="iic/emotion2vec_base_finetuned")

if True:
    file_ = 'emo/happy.mp3'
    rec_result = inference_pipeline(file_, granularity="utterance", extract_embedding=False)
    rec_result = rec_result[0]

    print("情绪识别音频文件:",file_)
    for  i in range(len(rec_result["labels"])):
        print("[{}] {} : {:.2f}".format(i,rec_result["labels"][i],rec_result["scores"][i]))

    # 使用max()函数找到列表中的最大值
    max_value = max(rec_result["scores"])

    # 找到所有最大值的索引
    max_indices = [index for index, value in enumerate(rec_result["scores"]) if value == max_value][0]
    # print(max_indices)
    print("\n -> 预测情绪:{} : {}".format(rec_result["labels"][max_indices],rec_result["scores"][max_indices]))

脚本执行log如下:

情绪识别音频文件: emo/happy.mp3
[0] 生气/angry : 0.00
[1] 厌恶/disgusted : 0.00
[2] 恐惧/fearful : 0.00
[3] 开心/happy : 1.00
[4] 中立/neutral : 0.00
[5] 其他/other : 0.00
[6] 难过/sad : 0.00
[7] 吃惊/surprised : 0.00
[8] <unk> : 0.00

 -> 预测情绪:开心/happy : 1.0

 ​​​

助力快速掌握数据集的信息和使用方式。

数据可以如此美好!


http://www.kler.cn/a/411820.html

相关文章:

  • QT6学习第四天 感受QT的文件编译
  • Android 11 三方应用监听关机广播ACTION_SHUTDOWN
  • 图论入门编程
  • CentOS7卸载node
  • Elasticsearch面试内容整理-高级特性
  • [极客大挑战 2019]BabySQL--详细解析
  • 什么是 C++ 中的 Lambda 表达式?Lambda 表达式可以捕获哪些类型的变量?有哪些捕获方式?
  • python的交互式编程
  • 触想工业显示器应用于光伏自动化设备,助力绿色低碳能源发展
  • YOLOv8模型pytorch格式转为onnx格式
  • js.二叉树的层序遍历2
  • [C++]:IO流
  • JavaWeb后端开发知识储备2
  • 嵌入式QT中UDP通信实现方法
  • 单例模式入门
  • 文件系统的作用
  • C++条件编译指令:#if、#elif、#ifdef、#ifndef、#elifdef、#elifndef、#else、#endif
  • On-Chip-Network之routing
  • [HarmonyOS] 解决HMRouter路由地址无法抽取的问题
  • C#上机练习66-70
  • 网络安全防范
  • 鸿蒙HarmonyOS学习笔记(4)
  • 3D导航案例
  • 钉钉与企业微信机器人:助力网站定时任务高效实现
  • RTMP协议
  • 基于matlab的电力系统潮流计算