语音合成方法、装置、计算机设备、存储介质和产品
公开
摘要
本申请实施例公开了一种语音合成方法、装置、计算机设备、存储介质和产品,通过获取待合成语音的文本,以及确定所要合成的语音类型;将语音类型对应的参考音频特征信息与文本中的文本单元进行融合处理,得到文本语音特征信息;根据语音类型确定目标时长预测网络;根据目标时长预测网络和文本语音特征信息预测文本单元对应的音频时长信息;根据音频时长信息对文本语音特征信息进行时长匹配处理,得到匹配后文本语音特征信息;根据匹配后文本语音特征信息进行语音合成处理,得到目标语音。该方案可以提取准确的文本语音特征信息,且根据语音类型采用对应的时长预测网络,使得合成的目标语音保留语音类型的音色和韵律等信息,提高语音合成效果。
基本信息
专利标题 :
语音合成方法、装置、计算机设备、存储介质和产品
专利标题(英):
暂无
公开(公告)号 :
CN114333758A
申请号 :
CN202111302064.3
公开(公告)日 :
2022-04-12
申请日 :
2021-11-04
授权号 :
暂无
授权日 :
暂无
发明人 :
林诗伦蒙力苏文超李新辉卢鲤
申请人 :
腾讯科技(深圳)有限公司
申请人地址 :
广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构 :
深圳翼盛智成知识产权事务所(普通合伙)
代理人 :
李玉婷
优先权 :
CN202111302064.3
主分类号 :
G10L13/02
IPC分类号 :
G10L13/02 G10L13/047 G10L13/10
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L13/00
语音合成;文本-语音合成系统
G10L13/02
产生合成语音的方法;语音合成设备
法律状态
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载