一种自适应语音增强的语音交互方法、系统及存储介质
实质审查的生效
摘要

本申请提供了一种自适应语音增强的语音交互方法,该方法包括:获取用户输入的语音文件,并通过语音识别得到相应的文本文件;根据seq2seq端到端模型得到机器回复的文本文件;将机器回复的文本文件进行文本分析,并送入声学模型中进行训练,获取语音特征,通过声码器合成语音;获取伦巴第语音音频的德语语料库作为训练数据集,采用训练数据集通过声码器提取出语音中的特征频谱包络MCCs和基频f0;通过声压计实时获取当前环境噪声等级;将特征频谱包络MCCs特征和当前环境噪声等级输入噪声自适应自注意StarGAN网络模型中进行模型的测试,根据实时噪声等级进行相应的语音风格转换,并输出语音增强后的语音。

基本信息
专利标题 :
一种自适应语音增强的语音交互方法、系统及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114464207A
申请号 :
CN202111393902.2
公开(公告)日 :
2022-05-10
申请日 :
2021-11-23
授权号 :
暂无
授权日 :
暂无
发明人 :
李登实叶海洋赵兰馨高雨薛童陈天卓陈奥何佳欣吴梓煊
申请人 :
江汉大学
申请人地址 :
湖北省武汉市沌口经济技术开发区新江大路8号
代理机构 :
北京众达德权知识产权代理有限公司
代理人 :
潘行
优先权 :
CN202111393902.2
主分类号 :
G10L21/0364
IPC分类号 :
G10L21/0364  G10L15/22  G10L15/26  G10L15/16  G10L15/06  G10L15/02  G10L25/30  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L21/00
为了改变语音或声音信号的质量或其可识度而处理语音或声音信号,以产生另一种可听的或非可听的信号,例如视觉信号或触觉信号
G10L21/02
语音增强,例如降低噪声或消除回声
G10L21/0316
通过改变振幅
G10L21/0364
用于提高可识度
法律状态
2022-05-27 :
实质审查的生效
IPC(主分类) : G10L 21/0364
申请日 : 20211123
2022-05-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332