混合语音识别网络训练方法、混合语音识别方法、装置及存储介...
授权
摘要

本申请提供了一种混合语音识别网络训练方法,包括:通过混合语音识别网络中的深度神经网络获取适应语音样本和混合语音样本;通过深度神经网络确定与适应语音样本对应的适应语音样本的向量;通过混合语音识别网络对适应语音样本的向量和相应的有监督标注进行处理,形成目标对象在向量空间的语音提取子;通过混合语音识别网络,利用混合语音样本的向量和语音提取子确定目标对象的掩码;通过目标对象的掩码与目标对象的参考语音,对混合语音识别网络的参数进行更新。本发明还提供了一种混合语音识别方法、混合语音识别装置及计算机可读存储介质。本申请技术方案可从混合语音中确定出目标对象的语音,方便对混合语音中目标对象的语音进行追踪。

基本信息
专利标题 :
混合语音识别网络训练方法、混合语音识别方法、装置及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN110797021A
申请号 :
CN201910745788.1
公开(公告)日 :
2020-02-14
申请日 :
2018-05-24
授权号 :
CN110797021B
授权日 :
2022-06-07
发明人 :
王珺陈杰苏丹俞栋
申请人 :
腾讯科技(深圳)有限公司
申请人地址 :
广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构 :
北京派特恩知识产权代理有限公司
代理人 :
王花丽
优先权 :
CN201910745788.1
主分类号 :
G10L15/22
IPC分类号 :
G10L15/22  G10L15/02  G10L15/07  G10L15/16  G10L25/24  G10L25/30  
相关图片
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/22
在语音识别过程中使用的程序
法律状态
2022-06-07 :
授权
2020-03-10 :
实质审查的生效
IPC(主分类) : G10L 15/22
申请日 : 20180524
2020-02-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN110797021A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332