基于迁移学习的歌声合成方法、装置及存储介质

授权

摘要

本发明涉及语言信号处理领域，本发明提出一种基于迁移学习的歌声合成方法、装置及存储介质，其中的方法包括：基于语音数据库获取读模型训练数据；基于读模型训练数据训练读模型，读模型输出与语音特征及语音标签数据对应的声音声学特征；获取唱模型训练数据，基于唱模型训练数据创建唱模型；将待合成歌声的歌词输入读模型，生成与歌词对应的目标声音声学参数，同时将待合成的乐谱特征和读模型输出的与歌词对应的声音声学参数输入唱模型，输出目标歌声声学参数；通过声码器将目标歌声声学参数转换为歌声输出。本发明通过将歌声合成分为读与唱两个步骤，能够在有限的歌声数据下，学习出更好的歌声合成效果。

基本信息

专利标题：

基于迁移学习的歌声合成方法、装置及存储介质

专利标题（英）：

暂无

公开（公告）号：

CN110136689A

申请号：

CN201910262713.8

公开（公告）日：

2019-08-16

申请日：

2019-04-02

授权号：

CN110136689B

授权日：

2022-04-22

发明人：

王健宗曾振罗剑

申请人：

平安科技（深圳）有限公司

申请人地址：

广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

代理机构：

北京鸿元知识产权代理有限公司

代理人：

王迎

优先权：

CN201910262713.8

主分类号：

G10L13/033

IPC分类号：

G10L13/033 G10L13/04 G10L13/08 G10H1/00

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L13/00

语音合成；文本-语音合成系统

G10L13/02

产生合成语音的方法；语音合成设备

G10L13/033

声音编辑，例如操控合成设备的声音

法律状态

2022-04-22 ：

授权

2021-06-18 ：

实质审查的生效

IPC(主分类) : G10L 13/033
申请日 : 20190402

2019-08-16 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载