一种声纹识别模型训练的方法、装置以及存储介质

实质审查的生效

摘要

本发明公开了一种声纹识别模型训练的方法、装置以及存储介质。所述方法包括：获取音频训练集；对音频训练集中的至少部分音频数据进行音频反向操作，得到反向音频数据，将反向音频数据作为音频数据加入到音频训练集中；提取加入了反向音频数据的音频训练集中的所有音频数据的音频特征；使用所提取的音频数据的音频特征对预先构建的声纹识别模型进行训练；其中，声纹识别模型的输出为音频数据的嵌入特征序列。本发明的一种声纹识别模型训练的方法和装置，能够增加音频数据的数量及多样性，提升了声纹识别模型的识别效果及抗干扰性即鲁棒性。

基本信息

专利标题：

一种声纹识别模型训练的方法、装置以及存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114420136A

申请号：

CN202111582909.9

公开（公告）日：

2022-04-29

申请日：

2021-12-22

授权号：

暂无

授权日：

暂无

发明人：

徐敏肖龙源李稀敏叶志坚

申请人：

厦门快商通科技股份有限公司

申请人地址：

福建省厦门市软件园三期诚毅北大街63号1301单元

代理机构：

厦门市精诚新创知识产权代理有限公司

代理人：

高敏

优先权：

CN202111582909.9

主分类号：

G10L17/04

IPC分类号：

G10L17/04 G10L17/18

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L17/00

讲话者辨认或验证

G10L17/04

训练，登记或模型的建立

法律状态

2022-05-20 ：

实质审查的生效

IPC(主分类) : G10L 17/04
申请日 : 20211222

2022-04-29 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载