语音合成模型的训练方法、系统、电子设备和存储介质
实质审查的生效
摘要
本发明公开一种语音合成模型的训练方法,包括:采集多语种的多组语种音频数据。每组语种音频数据中包括多个说话人发音的多组语音数据。获取音素ipa映射表。根据音素ipa映射表和多语种的待训练文本,获取待训练文本所对应的待训练符号序列。训练待训练符号序列获取模型训练。本发明实施例通过一套以国际音标音素为基准的前端文本分析系统,弱化不同语言之间输出的音位的差异,不同语言相似的读音将被共享,有效缩减了训练单一语言所需要的数据量。有效改善了合成音的音质,并且在合成时通过输入不同风格的音频可以输出不同风格的合成音。同时具有更好的稳定性。
基本信息
专利标题 :
语音合成模型的训练方法、系统、电子设备和存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114267325A
申请号 :
CN202111657762.5
公开(公告)日 :
2022-04-01
申请日 :
2021-12-30
授权号 :
暂无
授权日 :
暂无
发明人 :
刘亚祝
申请人 :
思必驰科技股份有限公司
申请人地址 :
江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
代理机构 :
北京商专永信知识产权代理事务所(普通合伙)
代理人 :
黄谦
优先权 :
CN202111657762.5
主分类号 :
G10L13/02
IPC分类号 :
G10L13/02 G10L13/08 G10L13/10 G10L19/008 G06F16/33
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L13/00
语音合成;文本-语音合成系统
G10L13/02
产生合成语音的方法;语音合成设备
法律状态
2022-04-19 :
实质审查的生效
IPC(主分类) : G10L 13/02
申请日 : 20211230
申请日 : 20211230
2022-04-01 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载