语音合成方法、模型训练方法、设备及存储介质

实质审查的生效

摘要

本申请提供一种语音合成方法、模型训练方法、设备及存储介质，该语音合成方法包括：获取待合成文本，输入到训练好的目标语音合成模型，得到待合成文本对应的目标语音；其中，根据预训练集对预设的语音合成模型进行预训练得到语音合成模型；采用目标应用场景对应的目标时长预测网络替换语音合成模型的时长预测网络，得到目标语音合成模型；获取目标训练集，目标训练集包括目标说话人的语音样本；从预训练集中挑选出目标说话人的同类说话人的语音样本进行mask加噪得到加噪语音样本；根据目标训练集和加噪语音样本对目标语音合成模型进行训练，得到训练好的目标语音合成模型。本申请能够合成与特定说话人说话风格更为契合的高质量自然流畅语音。

基本信息

专利标题：

语音合成方法、模型训练方法、设备及存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114283783A

申请号：

CN202111674186.5

公开（公告）日：

2022-04-05

申请日：

2021-12-31

授权号：

暂无

授权日：

暂无

发明人：

宋锐江源

申请人：

科大讯飞股份有限公司

申请人地址：

安徽省合肥市高新开发区望江西路666号

代理机构：

深圳市力道知识产权代理事务所(普通合伙)

代理人：

何姣

优先权：

CN202111674186.5

主分类号：

G10L13/02

IPC分类号：

G10L13/02 G10L13/10 G10L17/04 G10L17/22 G10L25/60

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L13/00

语音合成；文本-语音合成系统

G10L13/02

产生合成语音的方法；语音合成设备

法律状态

2022-04-22 ：

实质审查的生效

IPC(主分类) : G10L 13/02
申请日 : 20211231

2022-04-05 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载