用于说话人识别的网络模型训练方法、装置及存储介质

实质审查的生效

摘要

本发明涉及语音识别技术领域，具体是涉及用于说话人识别的网络模型训练方法、装置及存储介质。本发明首先将跨域的说话人样本数据集和音素样本数据集分别输入到一个多任务网络模型中，根据说话人分类子网和音素分类子网输出的结果，采用最大均值差异算法计算这两个结果之间的差异损失值,并作为总损失的一部分，通过增加了差异损失值的总损失不断去训练多任务网络模型，最终得到训练之后的模型，而训练之后的说话人子网模型对不同域的音素样本数据集具有较高的泛化能力，即训练之后的模型能够弱化跨域音素样本数据集与说话人样本数据集所具有的差异给网络模型识别说话人准确性所带来的影响。

基本信息

专利标题：

用于说话人识别的网络模型训练方法、装置及存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114360552A

申请号：

CN202111495680.5

公开（公告）日：

2022-04-15

申请日：

2021-12-08

授权号：

暂无

授权日：

暂无

发明人：

王佳兰天浩林秋镇李坚强

申请人：

深圳大学

申请人地址：

广东省深圳市南山区南海大道3688号

代理机构：

深圳市君胜知识产权代理事务所(普通合伙)

代理人：

王娅洁

优先权：

CN202111495680.5

主分类号：

G10L17/04

IPC分类号：

G10L17/04 G10L17/02 G10L17/14 G10L15/02 G06K9/62

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L17/00

讲话者辨认或验证

G10L17/04

训练，登记或模型的建立

法律状态

2022-05-31 ：

实质审查的生效

IPC(主分类) : G10L 17/04
申请日 : 20211208

2022-04-15 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载