语音合成模型的训练方法、系统、电子设备和存储介质

实质审查的生效

摘要

本发明公开一种语音合成模型的训练方法，包括：采集多语种的多组语种音频数据。每组语种音频数据中包括多个说话人发音的多组语音数据。获取音素ipa映射表。根据音素ipa映射表和多语种的待训练文本，获取待训练文本所对应的待训练符号序列。训练待训练符号序列获取模型训练。本发明实施例通过一套以国际音标音素为基准的前端文本分析系统，弱化不同语言之间输出的音位的差异，不同语言相似的读音将被共享，有效缩减了训练单一语言所需要的数据量。有效改善了合成音的音质，并且在合成时通过输入不同风格的音频可以输出不同风格的合成音。同时具有更好的稳定性。

基本信息

专利标题：

语音合成模型的训练方法、系统、电子设备和存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114267325A

申请号：

CN202111657762.5

公开（公告）日：

2022-04-01

申请日：

2021-12-30

授权号：

暂无

授权日：

暂无

发明人：

刘亚祝

申请人：

思必驰科技股份有限公司

申请人地址：

江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋

代理机构：

北京商专永信知识产权代理事务所(普通合伙)

代理人：

黄谦

优先权：

CN202111657762.5

主分类号：

G10L13/02

IPC分类号：

G10L13/02 G10L13/08 G10L13/10 G10L19/008 G06F16/33

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L13/00

语音合成；文本-语音合成系统

G10L13/02

产生合成语音的方法；语音合成设备

法律状态

2022-04-19 ：

实质审查的生效

IPC(主分类) : G10L 13/02
申请日 : 20211230

2022-04-01 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载