一种基于音素和韵律结构的中文语音合成方法
授权
摘要

本发明提供一种基于音素和韵律结构的中文语音合成方法,该方法分为训练阶段和合成阶段;根据语言学知识,从待处理文本中的韵律标注信息中提取出韵律结构特征,基于韵律结构特征训练韵律模型;对待处理文本和音频进行预处理,得到包含韵律信息的拼音序列及对应的声学特征,然后训练声学模型,将训练好的韵律模型和声学模型部署到后台;根据韵律模型获得与输入文本对应的包含其韵律信息的文本;再转换为带有韵律信息的拼音序列后输入到声学模型得到其线性频谱;将线性频谱转换为音频。可以使合成的声音更加自然,特别是对于较长的分句,也能确定出停顿位置,另外在合成阶段将模型部署到后台,省去模型加载的时间,这样可以加快语音合成的速度。

基本信息
专利标题 :
一种基于音素和韵律结构的中文语音合成方法
专利标题(英):
暂无
公开(公告)号 :
CN110534089A
申请号 :
CN201910621398.3
公开(公告)日 :
2019-12-03
申请日 :
2019-07-10
授权号 :
CN110534089B
授权日 :
2022-04-22
发明人 :
张春霞谢壮壮
申请人 :
西安交通大学
申请人地址 :
陕西省西安市咸宁西路28号
代理机构 :
西安通大专利代理有限责任公司
代理人 :
范巍
优先权 :
CN201910621398.3
主分类号 :
G10L13/10
IPC分类号 :
G10L13/10  G10L13/08  G10L25/24  G10L25/30  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L13/00
语音合成;文本-语音合成系统
G10L13/08
文本分析或文本以外的语音合成参数的产生,例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13/10
来自文本的韵律规则;重音或声调
法律状态
2022-04-22 :
授权
2019-12-27 :
实质审查的生效
IPC(主分类) : G10L 13/10
申请日 : 20190710
2019-12-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332