一种面向语音识别的语音增强方法

授权

摘要

本发明公开了一种面向语音识别的语音增强方法，包括：步骤1，利用近端麦克风和远端麦克风录制得到的语音，对干净语音进行估计；步骤2，将步骤1中得到的估计语音作为参考语音信号，计算参考语音和待测降噪语音的包络相关系数，构造和语音识别相关的模型优化目标函数；步骤3，构建语音增强的深度神经网络模型，训练目标为估计语音，模型优化目标函数由步骤2得到；根据优化结果实现语音增强。本发明方法利用估计语音提高语音识别性能，并保证了人耳听觉感知质量，更适用于面向语音识别的语音增强。

基本信息

专利标题：

一种面向语音识别的语音增强方法

专利标题（英）：

暂无

公开（公告）号：

CN110970044A

申请号：

CN201911180882.3

公开（公告）日：

2020-04-07

申请日：

2019-11-27

授权号：

CN110970044B

授权日：

2022-06-07

发明人：

杨玉红冯佳倩蔡林君涂卫平艾浩军高戈

申请人：

武汉大学

申请人地址：

湖北省武汉市武昌区珞珈山武汉大学

代理机构：

武汉科皓知识产权代理事务所(特殊普通合伙)

代理人：

严彦

优先权：

CN201911180882.3

主分类号：

G10L21/02

IPC分类号：

G10L21/02 G10L25/30 G10L15/06 G10L15/22

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L21/00

为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号

G10L21/02

语音增强，例如降低噪声或消除回声

法律状态

2022-06-07 ：

授权

2020-05-01 ：

实质审查的生效

IPC(主分类) : G10L 21/02
申请日 : 20191127

2020-04-07 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载