基于注意力机制的声纹识别方法及装置

公开

摘要

本发明公开的实施例公开了基于注意力机制的声纹识别方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括：获取目标声学特征；将目标声学特征输入至预先训练的帧级别特征提取网络，得到帧级别语音特征；对帧级别语音特征进行过滤，得到目标语音特征；基于目标语音特征、归一化指数函数和目标特征库，生成目标声学特征对应的识别结果。该实施方式使声学特征充分的展现并且有效利用，使得最后生成的结果更加精确。

基本信息

专利标题：

基于注意力机制的声纹识别方法及装置

专利标题（英）：

暂无

公开（公告）号：

CN114420135A

申请号：

CN202111516460.6

公开（公告）日：

2022-04-29

申请日：

2021-12-10

授权号：

暂无

授权日：

暂无

发明人：

孔天龙宋丹丹欧阳鹏尹首一

申请人：

江苏清微智能科技有限公司

申请人地址：

江苏省南京市江宁区麒麟科技创新园创研路266号人工智能产业园8号楼3层

代理机构：

北京索睿邦知识产权代理有限公司

代理人：

李根

优先权：

CN202111516460.6

主分类号：

G10L17/02

IPC分类号：

G10L17/02 G10L17/18 G10L17/04

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L17/00

讲话者辨认或验证

G10L17/02

预处理操作，例如：片断选择；模式表示或模拟，例如基于线性判别式分析或主要部件；特征选择或提取

法律状态

2022-04-29 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载