一种基于联合字典学习和稀疏表示的单通道语音增强方法

授权

摘要

本发明提供一种基于联合字典学习和稀疏表示的单通道语音增强方法，对干净语音做双树复数小波变换得到一组子带信号，对子带信号做短时傅里叶变换得到其时频谱，利用其幅度、实部和虚部以及语音稀疏性学习出干净语音的联合字典，同样学习出干净噪声的联合字典；对带噪语音做双树复数小波变换和短时傅里叶变换，获得每个子带信号时频谱，保留相位和实部虚部符号，提取幅度、实部和虚部绝对值并分别在干净语音和干净噪声联合字典上投影，得到语音和噪声的稀疏表示系数，利用该系数、时频谱相位和实部虚部符号以及掩码、权值等，得到该子带语音时频谱的最终估计，做短时傅里叶逆变换和双树复数小波逆变换，得到增强后的语音信号，提高了语音增强能力。

基本信息

专利标题：

一种基于联合字典学习和稀疏表示的单通道语音增强方法

专利标题（英）：

暂无

公开（公告）号：

CN111508518A

申请号：

CN202010454159.6

公开（公告）日：

2020-08-07

申请日：

2020-05-26

授权号：

CN111508518B

授权日：

2022-05-13

发明人：

叶中付穆罕默德绍希杜尔·伊斯兰姆

申请人：

中国科学技术大学

申请人地址：

安徽省合肥市包河区金寨路96号

代理机构：

北京科迪生专利代理有限责任公司

代理人：

顾炜

优先权：

CN202010454159.6

主分类号：

G10L21/0216

IPC分类号：

G10L21/0216 G10L25/30 G06F17/14

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L21/00

为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号

G10L21/02

语音增强，例如降低噪声或消除回声

G10L21/0208

噪声过滤

G10L21/0216

以噪声估计使用的方法为特征的

法律状态

2022-05-13 ：

授权

2020-09-01 ：

实质审查的生效

IPC(主分类) : G10L 21/0216
申请日 : 20200526

2020-08-07 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载