当前位置: 首页 > article >正文

phonemizer 获取英文文本句子单词音素 - python实现

使用 phonemizer 获取英文文本句子单词音素。

安装 phonemizer 库。

pip install phonemizer

具体代码实现如下:

# -*-coding:utf-8-*-
# date:2024-11
# Author: DataBall - XIAN
# Function: 获取英文文本句子单词音素
from phonemizer import phonemize
from phonemizer.backend import EspeakBackend
from phonemizer.punctuation import Punctuation
from phonemizer.separator import Separator

# en-gb – 英国英语
# en-us – 美国英语

language_ = "en-us" # 语言

print("语言类型 :{}".format(language_))
backend = EspeakBackend(language_)
print("\n-------------------------------->>")
text = "hello Tom , my name is Lily  !"
# 整句音素
phonemes = phonemize(text, language=language_, backend='espeak', strip=True)
print("整句文本: {}: ".format(text))
print("整句音素:{}".format(phonemes))

print("\n-------------------------------->>")
# 按词分割音素
words = [word for word in text.lower().split(' ')]
# 音素之间用空格分割
phonemes_word = Separator(phone=' ', word=None)
dict_ = {word: backend.phonemize([word], separator=phonemes_word, strip=True)[0] for word in words}

print("打印音素字典:")
i = 0
for key_ in dict_.keys():
    i += 1
    if len(dict_[key_])>0: # 去除标点符号干扰
        print(" [{}] {} : {}".format(i,key_,dict_[key_]))

选择语言”en-us“执行log如下:

语言类型 :en-us

-------------------------------->>
整句文本: hello Tom , my name is Lily  !:
整句音素:həloʊ tɑːm maɪ neɪm ɪz lɪli

-------------------------------->>
打印音素字典:
 [1] hello : h ə l oʊ
 [2] tom : t ɑː m
 [4] my : m aɪ
 [5] name : n eɪ m
 [6] is : ɪ z
 [7] lily : l ɪ l i

选择语言”en-gb“执行log如下:

语言类型 :en-gb

-------------------------------->>
整句文本: hello Tom , my name is Lily  !:
整句音素:hələʊ tɒm maɪ neɪm ɪz lɪli

-------------------------------->>
打印音素字典:
 [1] hello : h ə l əʊ
 [2] tom : t ɒ m
 [4] my : m aɪ
 [5] name : n eɪ m
 [6] is : ɪ z
 [7] lily : l ɪ l i

 ​​

DataBall 助力快速掌握数据集的信息和使用方式。

数据可以如此美好!


http://www.kler.cn/a/397401.html

相关文章:

  • 重置docker版本的octoprint管理员账号密码
  • hive表名重命名、rename重命名
  • Python习题 250:删除空文件夹
  • 解决部署RKE2或K3S-“docker.io/rancher/mirrored-pause:3.6\“: -无法拉取镜像办法
  • 基于Spring Boot的电子商务系统设计
  • @Autowired 和 @Resource思考(注入redisTemplate时发现一些奇怪的现象)
  • 智能工厂的设计软件 为了监管控一体化的全能Supervisor 的监督学习 之 序2 架构for认知系统 :机器学习及其行动门上的机器人
  • Gitcode文件历史记录查看和还原
  • 论文解析:基于区块链的去中心化服务选择,用于QoS感知的云制造(四区)
  • C/C++基础知识复习(19)
  • 【Docker容器】一、一文了解docker
  • shell脚本(2)
  • 【分布式】万字图文解析——深入七大分布式事务解决方案
  • 数据结构C语言描述3(图文结合)--双链表、循环链表、约瑟夫环问题
  • 2024智能机器人与自动控制国际学术会议 (IRAC 2024)
  • docker构建多平台容器
  • 前端无感刷新token
  • Vue的局部使用
  • 腾讯IM uniapp微信小程序版本实现迅飞语音听写(流式版)
  • 【机器学习chp2】贝叶斯最优分类器、概率密度函数的参数估计、朴素贝叶斯分类器、高斯判别分析。万字超详细分析总结与思考
  • Typora右键打开文件夹/设置右键打开方式/Windows右键管理器
  • 源码解析-Spring Eureka(更新ing)
  • HTML面试题(2)
  • 前端性能优化之R树的使用
  • IDEA自定义文件打开格式
  • 【蓝桥等考C++真题】蓝桥杯等级考试C++组第13级L13真题原题(含答案)-套娃