语音合成方法、装置、介质、计算机设备和程序产品

公开

摘要

本申请提供了一种语音合成方法、装置、介质、计算机设备和程序产品，可应用于人工智能、语音技术、语音合成等各种场景。该方法应用于语音合成模型，包括：获取目标文本对应的音素序列以及目标说话人对应的参考音频；根据音素序列提取音素中间特征；根据音素中间特征以及参考音频确定细粒度说话人表征，细粒度说话人表征为针对目标说话人对应于音素中间特征的声音特征的细粒度描述；根据音素中间特征和细粒度说话人表征合成目标语音，可以建模更加细粒度的说话人特征，从而提高合成语音与目标说话人声音的细节相似度。

基本信息

专利标题：

语音合成方法、装置、介质、计算机设备和程序产品

专利标题（英）：

暂无

公开（公告）号：

CN114360493A

申请号：

CN202111536786.5

公开（公告）日：

2022-04-15

申请日：

2021-12-15

授权号：

暂无

授权日：

暂无

发明人：

吴志勇周逸轩宋长河卞衍尧

申请人：

腾讯科技（深圳）有限公司;清华大学深圳国际研究生院

申请人地址：

广东省深圳市南山区高新区科技中一路腾讯大厦35层

代理机构：

北京励诚知识产权代理有限公司

代理人：

周慧云

优先权：

CN202111536786.5

主分类号：

G10L13/08

IPC分类号：

G10L13/08

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L13/00

语音合成；文本-语音合成系统

G10L13/08

文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定

法律状态

2022-04-15 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载