基于听觉中枢感知机理的说话人识别方法

授权

摘要

本发明公开了基于听觉中枢感知机理的说话人识别方法，步骤1：采用OM‑LSA算法与MCRA算法结合的方法对说话人语音信号进行降噪预处理；步骤2：利用STRF模型将预处理后的语音信号投射到特定的频谱‑时间空间，生成频域‑时间谱图，并进一步提取频域‑时间谱图的二次特征；步骤3：提取降噪预处理后语音信号中的MFCC系数特征；步骤4：将步骤2中的二次特征与步骤3中的MFCC系数进行组合；步骤5：采用常规的支持向量机对步骤4中二次特征与MFCC系数组合后的声纹特征进行分类与识别。本发明能够在强噪声环境下对说话人进行识别，具有较高的识别正确率，且对噪声具有较强的鲁棒性。

基本信息

专利标题：

基于听觉中枢感知机理的说话人识别方法

专利标题（英）：

暂无

公开（公告）号：

CN111508504A

申请号：

CN202010268019.X

公开（公告）日：

2020-08-07

申请日：

2020-04-08

授权号：

CN111508504B

授权日：

2022-06-07

发明人：

牛晓可黄伊鑫徐华兴王治忠

申请人：

郑州大学

申请人地址：

河南省郑州市高新技术开发区科学大道100号

代理机构：

成都弘毅天承知识产权代理有限公司

代理人：

宁政

优先权：

CN202010268019.X

主分类号：

G10L17/02

IPC分类号：

G10L17/02 G10L17/20 G10L25/03 G10L25/18 G10L25/24 G10L21/0208