一种基于多级残差卷积神经网络的语音情感识别方法
授权
摘要
本发明涉及一种基于多级残差卷积神经网络的语音情感识别方法,属于语音信号分析和图像处理等技术领域。该方法包括:1)训练过程:收集并预处理带所有情感的声音信号,生成语谱图;然后构建多级残差卷积神经网络,并将语谱图输入到多级残差卷积神经网络进行训练;2)测试过程:获取并预处理待识别声音信号,生成待识别语谱图;然后将待识别语谱图输入到训练好的多级残差卷积神经网络,得到识别结果。本发明通过跨越多级的残差块对CNN进行特征弥补,解决了对CNN随着卷积层加深而出现的特征丢失的问题,且提高识别率。
基本信息
专利标题 :
一种基于多级残差卷积神经网络的语音情感识别方法
专利标题(英):
暂无
公开(公告)号 :
CN111429947A
申请号 :
CN202010225783.9
公开(公告)日 :
2020-07-17
申请日 :
2020-03-26
授权号 :
CN111429947B
授权日 :
2022-06-10
发明人 :
郑凯夏志广张毅
申请人 :
重庆邮电大学
申请人地址 :
重庆市南岸区黄桷垭崇文路2号
代理机构 :
北京同恒源知识产权代理有限公司
代理人 :
赵荣之
优先权 :
CN202010225783.9
主分类号 :
G10L25/63
IPC分类号 :
G10L25/63 G10L25/18 G10L15/06 G06N3/04
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L25/00
不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术
G10L25/48
专门适用于特定用途
G10L25/51
比较或判别
G10L25/63
情感状态估计
法律状态
2022-06-10 :
授权
2020-08-11 :
实质审查的生效
IPC(主分类) : G10L 25/63
申请日 : 20200326
申请日 : 20200326
2020-07-17 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载