语音增强模型的训练方法及系统

授权

摘要

本发明实施例提供一种语音增强模型的训练方法。该方法包括：接收纯净语音和与纯净语音对应的带噪语音；分别提取纯净语音的第一音频谱特征和带噪语音的第二音频谱特征；对带噪语音的第二音频谱特征进行压缩以生成第一深度语音特征；对第一深度语音特征进行去噪，得到去噪后的第二深度语音特征；对第二深度语音特征进行音频谱恢复，得到带噪语音的第三音频谱特征；确定纯净语音的第一音频谱特征和带噪语音的第三音频谱特征的特征均方误差，基于均方误差训练语音增强模型，直至特征均方误差符合预设阈值，确定语音增强模型。本发明实施例还提供一种语音增强模型的训练系统。本发明实施例使得语音增强模型具备解决噪声和远场的能力，提高识别性能。

基本信息

专利标题：

语音增强模型的训练方法及系统

专利标题（英）：

暂无

公开（公告）号：

CN110956957A

申请号：

CN201911337710.2

公开（公告）日：

2020-04-03

申请日：

2019-12-23

授权号：

CN110956957B

授权日：

2022-05-17

发明人：

赵飞黄厚军钱彦旻

申请人：

苏州思必驰信息科技有限公司

申请人地址：

江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋

代理机构：

北京商专永信知识产权代理事务所(普通合伙)

代理人：

黄谦

优先权：

CN201911337710.2

主分类号：

G10L15/06

IPC分类号：

G10L15/06 G10L17/00 G10L17/06 G10L17/18 G10L21/02 G10L21/0208 G10L21/0216 G10L25/18 G10L25/24 G10L25/30