一种可调噪声抑制深度的神经网络语音增强方法
实质审查的生效
摘要

本发明涉及语音处理技术领域,具体涉及一种可调噪声抑制深度的神经网络语音增强方法。该方法包括:将理想数据的带噪语音进行特征提取的结果作为网络模型的输入进行训练,网络输出目标为目标增益函数,优化网络输出的增益函数;在网络模型训练中重构损失函数,对网络模型进行优化,使网络模型从带噪语音特征中映射出最优增益函数。本发明通过设置额外的噪声抑制模块解决了目前基于TMF的深度神经网络语音增强算法的噪声残留问题;噪声抑制模块可以在原有的增强效果上进一步提高语音质量,通过降噪深度调节因子,可以根据日常应用需求,调整合适的降噪深度。

基本信息
专利标题 :
一种可调噪声抑制深度的神经网络语音增强方法
专利标题(英):
暂无
公开(公告)号 :
CN114387962A
申请号 :
CN202210018367.0
公开(公告)日 :
2022-04-22
申请日 :
2022-01-07
授权号 :
暂无
授权日 :
暂无
发明人 :
谢福仕欧阳康郑能恒
申请人 :
深圳大学
申请人地址 :
广东省深圳市南山区南海大道3688号
代理机构 :
深圳尚业知识产权代理事务所(普通合伙)
代理人 :
杨勇
优先权 :
CN202210018367.0
主分类号 :
G10L15/20
IPC分类号 :
G10L15/20  G10L21/02  G10L15/02  G06N3/08  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/20
专门适用于不利环境中保持鲁棒性或增强语音强度的语音识别技术
法律状态
2022-05-10 :
实质审查的生效
IPC(主分类) : G10L 15/20
申请日 : 20220107
2022-04-22 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332