当前位置: 首页 > article >正文

js -音频变音(听不出说话的人是谁)

学习参考来源:
https://zhuanlan.zhihu.com/p/634848804
https://developer.mozilla.org/zh-CN/docs/Web/API/Web_Audio_API

实际效果:
http://www.qingkong.zone/laboratory?type=audio-confusion

前言

本文内容可结合上面学习参考来源,结合学习。
之前我遇到的需求主要是对人声进行变音处理,以确保无法通过声音识别出是谁说的这个话,保护隐私。通过Web Audio API即可实现该变声效果。

1. 获取Audio上下文

const audioCtx = new (window.AudioContext || window.webkitAudioContext)();

2. 用 audioCtx 与音频源做关联

各个音频源关联方法:

(1) 与audio,vidio标签 或 Audio实例

const audio = new Audio()
const sourceNode = audioCtx.createMediaElementSource(audio)

(2) 获取麦克风

const stream = await navigator.mediaDevices
  .getUserMedia({ audio: true})
  .catch(function (error) {
    console.log(error);
  });
const sourceNode = audioCtx.createMediaStreamSource(stream)

(3) 使用 缓冲器

const loadAudioBuffer = async (url) => {
  const response = await fetch(url);
  const arrayBuffer = await response.arrayBuffer();
  return await audioCtx.decodeAudioData(arrayBuffer);
}
// 获取 audioBuffer
loadAudioBuffer(props.url).then((audioBuffer) => {
  audioCtx.audioBuffer = audioBuffer;
}).catch((error) => {
  console.error("Failed to load audio buffer:", error);
});

// 创建缓冲区
const bufferNode = audioCtx.createBufferSource()

需要注意:缓冲区只能播放一次,所以创建缓冲区逻辑要与播放逻辑放在一起

3. 使用缓冲区后,改写原有音频播放、暂停

声音流添加处理效果就像穿项链一样,一个接一个(引自学习参考来源1)

// 创建多个不同作用功能的node节点
var analyser = audioCtx.createAnalyser();
var distortion = audioCtx.createWaveShaper();
var gainNode = audioCtx.createGain();
var biquadFilter = audioCtx.createBiquadFilter();
var convolver = audioCtx.createConvolver();

// 将所有节点连接在一起

source = audioCtx.createMediaStreamSource(stream);
source.connect(analyser);
analyser.connect(distortion);
distortion.connect(biquadFilter);
biquadFilter.connect(convolver);
convolver.connect(gainNode);
gainNode.connect(audioCtx.destination);

上述代码是帮助你理解 AudioContext 的处理节点如何添加,不是实现代码。
audioCtx.destination 是 AudioContext 的输出源

播放

  if (flag) {
    // 创建缓冲区
    bufferNode = audioCtx.createBufferSource()
    bufferNode.buffer = audioCtx.audioBuffer;
    bufferNode.playbackRate.value = umlautValue;
    
    // 用于修改音量
    gainNode = audioCtx.createGain();
    bufferNode.connect(gainNode);
    gainNode.connect(audioCtx.destination);
    gainNode.gain.value = audioData.volume / 100;
    
    bufferNode.startTime = audioCtx.currentTime - audioData.currentTime;
    bufferNode.start(0, audioData.currentTime);
    bufferNode.onended = () => {
      audioData.status = "play";
      cancelAnimationFrame(animationFrameId);
    };
  } else {
    audio.play()
  }

暂停

  if (flag) {
    bufferNode.stop();
    audioData.currentTime = audioCtx.currentTime - bufferNode.startTime;
    cancelAnimationFrame(animationFrameId);
  } else {
    audio.pause()
  }

4. 使用 requestAnimationFrame 代替 timeupdate 获取实时信息

const updateCurrentTime = () => {
  if (bufferNode && bufferNode.playbackState === bufferNode.PLAYING_STATE) {
    audioData.currentTime = audioCtx.currentTime - bufferNode.startTime;
    audioData.currentValue = audioData.currentTime / audioData.duration * 100 * umlautValue;
    audioData.currentFormat = `${moment.utc(audioData.currentTime * 1000 * umlautValue).format("mm:ss")} / ${moment.utc(audioData.duration * 1000).format("mm:ss")}`;
  }
  animationFrameId = requestAnimationFrame(updateCurrentTime);
}

在需要关闭的地方

cancelAnimationFrame(animationFrameId);

5. 音频变音核心逻辑

本文走的是 变速变调 的路子,改变声音播放速率情况下,音调音色也会随着改变,例如玩过磁带的都知道,按快进功能会使声音变尖提高音调,慢放功能使声音变粗,降低音调。

为了让音频进度条与 加速或减速 的速率保持一致,需创建个变量做统一管理

const umlautValue = 1.5

6. 结尾

在销毁前记得销毁这些节点

  if (bufferNode) {
    bufferNode.stop();
  }
  if (gainNode) {
    gainNode.disconnect();
  }
  cancelAnimationFrame(animationFrameId);

喜欢的话不妨点个小小的赞与关注,您的赞与关注将是我源源不断的前进动力。


http://www.kler.cn/a/470139.html

相关文章:

  • Taro地图组件和小程序定位
  • 关于Mac中的shell
  • 探索Whisper:从原理到实际应用的解析
  • EntityFramework Core 数据种子
  • 1/7距离放假一周加1
  • C语言 扫雷程序设计
  • Flink系列知识讲解之:网络监控、指标与反压
  • 计算机的错误计算(二百零三)
  • 2025年最新 Tensorflow paddlepaddle与CUDA 、Python、cuDNN的版本对应表 一一对应关系,torch和CUDA的对应表
  • 科普CMOS传感器的工作原理及特点
  • windows C#-如何在派生类中引发基类事件
  • SPringMVC(2)——SpringMVC请求
  • 通过 oh-my-posh posh-git 优化PowerShell
  • 『SQLite』详解运算符
  • Lua语言的字符串处理
  • Node.js 中 http 模块的深度剖析与实战应用
  • 面试经典150题——链表(二)
  • ASP.NET Core 中服务生命周期详解:Scoped、Transient 和 Singleton 的业务场景分析
  • 汉诺塔..
  • React:构建现代 Web 应用的利器
  • 基于Node.js的水产品销售平台
  • linux 查看 MySQL 在 Linux 或 WSL 上的运行状态
  • WebSocket 测试调试:工具与实践
  • 哺乳动物各器官和物种中长链非编码RNA的发育动态
  • JMeter + Grafana +InfluxDB性能监控 (二)
  • 『SQLite』索引