语音克隆方法、装置、训练方法、电子设备及存储介质
著录事项变更
摘要
本发明涉及语音克隆领域,公开了一种语音克隆方法、装置、训练方法、电子设备及存储介质。本发明中,语音克隆方法,包括:使用第一神经网络模型对待克隆语音的特征进行解耦合、得到所述待克隆语音的说话人特征,所述说话人特征为所述待克隆语音中与文本内容无关的特征,所述第一神经网络模型为多层神经网络模型;对待合成文本进行编码、得到所述待合成文本的文本内容特征;使用第二神经网络模型对所述待克隆语音的说话人特征和所述待合成文本的文本内容特征进行耦合,生成克隆语音。与现有技术相比,本发明实施方式所提供的语音克隆方法、装置及语音克隆装置的模型训练方法具有语音克隆模仿能力较强、训练数据量依赖性更低的优点。
基本信息
专利标题 :
语音克隆方法、装置、训练方法、电子设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114333847A
申请号 :
CN202111676414.2
公开(公告)日 :
2022-04-12
申请日 :
2021-12-31
授权号 :
暂无
授权日 :
暂无
发明人 :
李锐
申请人 :
达闼机器人有限公司
申请人地址 :
上海市闵行区中青路207号8幢
代理机构 :
北京智晨知识产权代理有限公司
代理人 :
张婧
优先权 :
CN202111676414.2
主分类号 :
G10L17/02
IPC分类号 :
G10L17/02 G10L17/04 G10L17/18 G10L19/00
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L17/00
讲话者辨认或验证
G10L17/02
预处理操作,例如:片断选择;模式表示或模拟,例如基于线性判别式分析或主要部件;特征选择或提取
法律状态
2022-05-06 :
著录事项变更
IPC(主分类) : G10L 17/02
变更事项 : 申请人
变更前 : 达闼机器人有限公司
变更后 : 达闼机器人股份有限公司
变更事项 : 地址
变更前 : 200245 上海市闵行区中青路207号8幢
变更后 : 200245 上海市闵行区中青路207号8幢
变更事项 : 申请人
变更前 : 达闼机器人有限公司
变更后 : 达闼机器人股份有限公司
变更事项 : 地址
变更前 : 200245 上海市闵行区中青路207号8幢
变更后 : 200245 上海市闵行区中青路207号8幢
2022-04-29 :
实质审查的生效
IPC(主分类) : G10L 17/02
申请日 : 20211231
申请日 : 20211231
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载