当前位置: 首页 > article >正文

24-12-28-pytorch深度学习中音频I/O 中遇到的问题汇总

文章目录

  • pytorch深度学习中音频I/O 中遇到的问题汇总
    • 问题1:音频文件格式的读取问题
    • 问题2:音频文件绘图问题
    • 小结

pytorch深度学习中音频I/O 中遇到的问题汇总

问题1:音频文件格式的读取问题

参考链接:torchaudio 加载wav报错 Couldn‘t find appropriate backend to handle uri *** and format None

主要是音频格式读取的问题,读取 ‘.wav’ 或 ‘.gsm’ 文件

metadata = torchaudio.info(SAMPLE_WAV)
print(metadata)

metadata = torchaudio.info(SAMPLE_GSM)
print(metadata)

这里的办法处理参考上面的链接外,可以采用在pytorch终端中 pip install soundfile 的办法。
在这里插入图片描述
可以通过一下代码查看 soundfile 库文件提供的可打开的文件格式。

import soundfile as sf
print(sf.available_formats())

问题2:音频文件绘图问题

参考链接:OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.解决

主要问题,会报下面一大堆话,如下所示:

OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.
OMP: Hint This means that multiple copies of the OpenMP runtime have been linked into the program.
That is dangerous, since it can degrade performance or cause incorrect results. The best thing to do is to ensure that only a single OpenMP runtime is linked into the process, e.g. by avoiding static linking of the OpenMP runtime in any library. 
As an unsafe, unsupported, undocumented workaround you can set the environment variable KMP_DUPLICATE_LIB_OK=TRUE to allow the program to continue to execute, but that may cause crashes or silently produce incorrect results. 
For more information, please see http://www.intel.com/software/products/support/.

主要问题是:多个环境中有这个 libiomp5md.dll 动态库,解决办法除了参考上面链接外。
(1) 可以使用 everything 软件,查找 libiomp5md.dll ,可以看到多个 libiomp5md.dll 文件,可以只留下所使用环境中的 libiomp5md.dll 文件,其他的 libiomp5md.dll 文件重命名为 libiomp5md__.dll
(2)或者 精准定位,只重命名 \Python312\site-packages\torch\lib 下的 libiomp5md.dll

在这里插入图片描述

小结

  看教程是一回事,自己做起来又是另一回事,会发现很多层出不穷的问题,多记录,多思考,多查资料,慢慢积累,终有所获。


http://www.kler.cn/a/456798.html

相关文章:

  • Docker搭建Skywalking
  • 【02】获取portal中服务地址的列表信息
  • AAAI 2025论文分享┆一种接近全监督的无训练文档信息抽取方法:SAIL(文中附代码链接)
  • 助你通过AI培训师中级考试的目录索引
  • Vscode左大括号不另起一行、注释自动换行
  • wxWidgets 3.2.5发布 —— 发布于2024年5月13日
  • 音视频入门基础:MPEG2-TS专题(24)——FFmpeg源码中,显示TS流每个packet的pts、dts的实现
  • python常用基础语法
  • win10系统上打包electron,实现在win7系统运行
  • Detected at node ‘truediv‘ defined at (most recent call last): Node: ‘truediv‘
  • BUU BRUTE 1
  • 剑指Offer|LCR 013. 二维区域和检索 - 矩阵不可变
  • LeetCode题练习与总结:IPO--502
  • linux查看访问外网本机ip地址的命令
  • 微信小程序打印生产环境日志
  • WordPress网站中如何修复504错误
  • 线程池基础知识
  • HTML5前端实现毛玻璃效果的可拖拽登录框
  • C/C++应该如何使用NI-488.2库?
  • 37. socketserver模块
  • 两种不同的LuaBehaviour生命周期绑定
  • 【Linux学习五】时间日期指令与查找指令
  • Slater 条件与 KKT 条件
  • 字符串存储、分割相关总结(strncpy 函数和strtok() 函数相关)
  • 钉钉h5微应用鉴权配置客户端 API 鉴权步骤
  • 智能网关在电力物联网中的应用