语音增强模型的训练方法、语音增强方法、装置以及设备

公开

摘要

本申请涉及网络直播技术领域，提出一种语音增强模型的训练方法、语音增强方法、装置、计算机设备及存储介质，该方法包括：获取语音增强模型的训练样本数据；根据训练样本数据中带噪语音信号的幅度谱和待训练的语音增强模型，获得预测的纯净语音信号幅度谱、预测的噪声语音信号幅度谱、预测的纯净语音信号、预测的噪声语音信号、预测的纯净语音信号的对数梅尔功率谱以及预测的噪声语音信号的对数梅尔功率谱；根据幅度谱、对数梅尔功率谱以及语音信号，获得语音增强损失值；根据语音增强损失值对语音增强模型进行优化训练，获得训练好的语音增强模型，提高语音增强模型的鲁棒性、使降噪效果明显。

基本信息

专利标题：

语音增强模型的训练方法、语音增强方法、装置以及设备

专利标题（英）：

暂无

公开（公告）号：

CN114582352A

申请号：

CN202210177493.0

公开（公告）日：

2022-06-03

申请日：

2022-02-24

授权号：

暂无

授权日：

暂无

发明人：

王海平

申请人：

广州方硅信息技术有限公司

申请人地址：

广东省广州市番禺区南村镇万博二路79号3108

代理机构：

广州骏思知识产权代理有限公司

代理人：

潘桂生

优先权：

CN202210177493.0

主分类号：

G10L17/04

IPC分类号：

G10L17/04 G10L21/0208

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L17/00

讲话者辨认或验证

G10L17/04

训练，登记或模型的建立

法律状态

2022-06-03 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载