语音合成方法及装置、设备以及存储介质
实质审查的生效
摘要
一种语音合成方法及装置、设备以及存储介质,所述语音合成方法包括:提供训练语料,所述训练语料包括说话人信息、语种信息以及文本信息;对所述说话人信息进行特征提取处理,获得说话人特征;对所述语种信息进行语种编码处理,获得语种编码结果;基于对所述说话人信息、以及对语种信息均进行解耦处理后更新的参数,对所述文本信息进行文本编码处理,获得文本编码结果;对所述文本编码结果、说话人特征以及所述语种编码结果进行解码处理,获得声学频谱;基于所述声学频谱,进行音频合成处理,生成与文本信息对应的语音音频。本发明实施例提高语音合成对多种语言进行交叉迁移的能力、节省语音合成的成本。
基本信息
专利标题 :
语音合成方法及装置、设备以及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114446278A
申请号 :
CN202210103280.3
公开(公告)日 :
2022-05-06
申请日 :
2022-01-27
授权号 :
暂无
授权日 :
暂无
发明人 :
李飞腾
申请人 :
上海流利说信息技术有限公司
申请人地址 :
上海市杨浦区长阳路1687号西1168幢(C楼)一层C2101室
代理机构 :
上海知锦知识产权代理事务所(特殊普通合伙)
代理人 :
吴凡
优先权 :
CN202210103280.3
主分类号 :
G10L13/02
IPC分类号 :
G10L13/02 G10L13/027 G10L25/30 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L13/00
语音合成;文本-语音合成系统
G10L13/02
产生合成语音的方法;语音合成设备
法律状态
2022-05-24 :
实质审查的生效
IPC(主分类) : G10L 13/02
申请日 : 20220127
申请日 : 20220127
2022-05-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载