基于注意力机制的声纹识别方法及装置
公开
摘要
本发明公开的实施例公开了基于注意力机制的声纹识别方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取目标声学特征;将目标声学特征输入至预先训练的帧级别特征提取网络,得到帧级别语音特征;对帧级别语音特征进行过滤,得到目标语音特征;基于目标语音特征、归一化指数函数和目标特征库,生成目标声学特征对应的识别结果。该实施方式使声学特征充分的展现并且有效利用,使得最后生成的结果更加精确。
基本信息
专利标题 :
基于注意力机制的声纹识别方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN114420135A
申请号 :
CN202111516460.6
公开(公告)日 :
2022-04-29
申请日 :
2021-12-10
授权号 :
暂无
授权日 :
暂无
发明人 :
孔天龙宋丹丹欧阳鹏尹首一
申请人 :
江苏清微智能科技有限公司
申请人地址 :
江苏省南京市江宁区麒麟科技创新园创研路266号人工智能产业园8号楼3层
代理机构 :
北京索睿邦知识产权代理有限公司
代理人 :
李根
优先权 :
CN202111516460.6
主分类号 :
G10L17/02
IPC分类号 :
G10L17/02 G10L17/18 G10L17/04
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L17/00
讲话者辨认或验证
G10L17/02
预处理操作,例如:片断选择;模式表示或模拟,例如基于线性判别式分析或主要部件;特征选择或提取
法律状态
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载