一种声纹识别模型训练方法、装置、设备及可读介质

实质审查的生效

摘要

本申请公开了一种声纹识别模型训练方法、装置、设备及可读介质，其中声纹模型训练方法包括以下步骤：获取训练集语音的有效语音帧；提取有效语音帧的MFCC特征，对相邻的有效语音帧的MFCC特征进行差异扩大处理；将差异扩大处理后的MFCC特征输入初始声纹识别模型，对初始声纹识别模型进行训练直至收敛，获得训练好的声纹识别模型。本申请实施例提供的声纹识别模型训练方法，通过对训练集语音进行有效语音分析，提取有效语音帧的MFCC特征，对相邻的有效语音帧的MFCC特征进行差异扩大处理，突出了相邻的有效语音帧的变化趋势，可以有效地增加声纹特征提取的有效性，从而获取声纹识别准确率高的声纹识别模型。

基本信息

专利标题：

一种声纹识别模型训练方法、装置、设备及可读介质

专利标题（英）：

暂无

公开（公告）号：

CN114464196A

申请号：

CN202210046711.7

公开（公告）日：

2022-05-10

申请日：

2022-01-17

授权号：

暂无

授权日：

暂无

发明人：

张广学肖龙源李稀敏叶志坚

申请人：

厦门快商通科技股份有限公司

申请人地址：

福建省厦门市软件园三期诚毅北大街63号1301单元

代理机构：

代理人：

优先权：

CN202210046711.7

主分类号：

G10L17/04

IPC分类号：

G10L17/04 G10L17/02 G10L25/24

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L17/00

讲话者辨认或验证

G10L17/04

训练，登记或模型的建立

法律状态

2022-05-27 ：

实质审查的生效

IPC(主分类) : G10L 17/04
申请日 : 20220117

2022-05-10 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载