基于变分自动编码器的跨语句语音合成方法、系统及设备
公开
摘要

本发明提供一种基于变分自动编码器的跨语句语音合成方法、系统及设备,通过将跨语句信息与用以增强韵律的变分自动编码器有机结合,提出了基于变分自动编码器的跨语句语音合成系统,通过条件化声学特征、说话人信息和当前及周围语句中获得的文本特征,来估计每个音素潜在韵律特征的后验概率分布;该系统包括跨语句表征模块和韵律增强模块,通过使用多头注意力层生成音素级别的跨语句表征,并将跨语句表征模块的输出作为韵律增强模块的特定语句的先验条件,以改进标准变分自动编码器。本申请不仅提升了合成语音的自然度,改善了合成语音的韵律变化,同时解决了推理时系统所采样的标准高斯先验和语音的真实先验之间不一致的问题。

基本信息
专利标题 :
基于变分自动编码器的跨语句语音合成方法、系统及设备
专利标题(英):
暂无
公开(公告)号 :
CN114566141A
申请号 :
CN202210220764.6
公开(公告)日 :
2022-05-31
申请日 :
2022-03-08
授权号 :
暂无
授权日 :
暂无
发明人 :
李阳郁程孙芳蕾田政汪军张超孙广智蒋桦
申请人 :
上海科技大学
申请人地址 :
上海市浦东新区华夏中路393号
代理机构 :
上海光华专利事务所(普通合伙)
代理人 :
李治东
优先权 :
CN202210220764.6
主分类号 :
G10L13/02
IPC分类号 :
G10L13/02  G10L13/04  G10L25/24  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L13/00
语音合成;文本-语音合成系统
G10L13/02
产生合成语音的方法;语音合成设备
法律状态
2022-05-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332