一种单声道鲁棒性的语音关键词实时检测方法
授权
摘要
本发明涉及的一种单声道鲁棒性的语音关键词实时检测方法,包括如下步骤:接收电子格式的带噪语音;逐帧用短时傅里叶变换把时域的语音信号转化为频域信号;使用梅尔滤波器对频域信号进行处理,得到的梅尔特征作为声学特征;梅尔特征逐帧经过神经网络再用归一化指数函数处理后得到每个关键词的置信度信息;当某一个关键词的置信度大于预先定义的阈值之后则取当前帧和往前推移若干帧拼接作为的神经网络的输出;当置信度数值大于预先定义的阈值,则认为检测到关键词,否则视为没有检测到关键词。本发明性能优秀,能够在嘈杂的环境中依然能够保持较高的唤醒率,具有更加广泛的实用性,能够大幅的降低神经网络的虚警率,提升了本发明的性能。
基本信息
专利标题 :
一种单声道鲁棒性的语音关键词实时检测方法
专利标题(英):
暂无
公开(公告)号 :
CN110767223A
申请号 :
CN201910945315.6
公开(公告)日 :
2020-02-07
申请日 :
2019-09-30
授权号 :
CN110767223B
授权日 :
2022-04-12
发明人 :
胡鹏闫永杰
申请人 :
大象声科(深圳)科技有限公司
申请人地址 :
广东省深圳市南山区粤海街道高新南环路29号留学生创业大厦一期2206
代理机构 :
深圳快马专利商标事务所(普通合伙)
代理人 :
赵亮
优先权 :
CN201910945315.6
主分类号 :
G10L15/22
IPC分类号 :
G10L15/22 G10L19/02 G10L19/26 G10L25/24 G10L25/30
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/22
在语音识别过程中使用的程序
法律状态
2022-04-12 :
授权
2022-03-22 :
著录事项变更
IPC(主分类) : G10L 15/22
变更事项 : 申请人
变更前 : 大象声科(深圳)科技有限公司
变更后 : 大象声科(深圳)科技有限公司
变更事项 : 地址
变更前 : 518000 广东省深圳市南山区粤海街道高新南环路29号留学生创业大厦一期2206
变更后 : 518000 广东省深圳市南山区粤海街道高新区社区科技南路18号深圳湾科技生态园12栋裙楼533
变更事项 : 申请人
变更前 : 大象声科(深圳)科技有限公司
变更后 : 大象声科(深圳)科技有限公司
变更事项 : 地址
变更前 : 518000 广东省深圳市南山区粤海街道高新南环路29号留学生创业大厦一期2206
变更后 : 518000 广东省深圳市南山区粤海街道高新区社区科技南路18号深圳湾科技生态园12栋裙楼533
2020-03-03 :
实质审查的生效
IPC(主分类) : G10L 15/22
申请日 : 20190930
申请日 : 20190930
2020-02-07 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载