音频分类识别方法、装置、电子设备及存储介质
实质审查的生效
摘要
本公开关于一种音频分类识别方法、装置、电子设备及存储介质。该方法包括:通过获取待识别音频的音频特征;然后将音频特征输入目标卷积神经网络,对目标卷积神经网络的末端解码单元输出的第一特征,以及目标卷积神经网络中的至少一个编码单元输出的第二特征,进行特征融合处理,得到待识别音频的目标音频特征;最后基于目标音频特征,确定待识别音频对应的分类识别结果。本公开实现了将目标卷积神经网络与音频分类识别进行结合,将音频特征利用目标卷积神经网络进行特征提取并融合,得到了待识别音频的多层次的目标音频特征,并依据该目标音频特征对待识别音频进行分类识别,提高了音频分类识别的准确性。
基本信息
专利标题 :
音频分类识别方法、装置、电子设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114333804A
申请号 :
CN202111610788.4
公开(公告)日 :
2022-04-12
申请日 :
2021-12-27
授权号 :
暂无
授权日 :
暂无
发明人 :
郑雪
申请人 :
北京达佳互联信息技术有限公司
申请人地址 :
北京市海淀区上地西路6号1幢1层101D1-7
代理机构 :
华进联合专利商标代理有限公司
代理人 :
冯右明
优先权 :
CN202111610788.4
主分类号 :
G10L15/16
IPC分类号 :
G10L15/16 G10L25/24
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/08
语音分类或检索
G10L15/16
利用人工神经网络
法律状态
2022-04-29 :
实质审查的生效
IPC(主分类) : G10L 15/16
申请日 : 20211227
申请日 : 20211227
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载