一种声纹识别模型训练方法、装置、设备及可读介质
实质审查的生效
摘要
本申请公开了一种声纹识别模型训练方法、装置、设备及可读介质,其中声纹模型训练方法包括以下步骤:获取训练集语音的有效语音帧;提取有效语音帧的MFCC特征,对相邻的有效语音帧的MFCC特征进行差异扩大处理;将差异扩大处理后的MFCC特征输入初始声纹识别模型,对初始声纹识别模型进行训练直至收敛,获得训练好的声纹识别模型。本申请实施例提供的声纹识别模型训练方法,通过对训练集语音进行有效语音分析,提取有效语音帧的MFCC特征,对相邻的有效语音帧的MFCC特征进行差异扩大处理,突出了相邻的有效语音帧的变化趋势,可以有效地增加声纹特征提取的有效性,从而获取声纹识别准确率高的声纹识别模型。
基本信息
专利标题 :
一种声纹识别模型训练方法、装置、设备及可读介质
专利标题(英):
暂无
公开(公告)号 :
CN114464196A
申请号 :
CN202210046711.7
公开(公告)日 :
2022-05-10
申请日 :
2022-01-17
授权号 :
暂无
授权日 :
暂无
发明人 :
张广学肖龙源李稀敏叶志坚
申请人 :
厦门快商通科技股份有限公司
申请人地址 :
福建省厦门市软件园三期诚毅北大街63号1301单元
代理机构 :
代理人 :
优先权 :
CN202210046711.7
主分类号 :
G10L17/04
IPC分类号 :
G10L17/04 G10L17/02 G10L25/24
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L17/00
讲话者辨认或验证
G10L17/04
训练,登记或模型的建立
法律状态
2022-05-27 :
实质审查的生效
IPC(主分类) : G10L 17/04
申请日 : 20220117
申请日 : 20220117
2022-05-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载