一种特定场景下的中英文混合的离线语音关键词识别方法及其系...
实质审查的生效
摘要
本公开的实施例公开了一种中英文混合的离线语音关键词识别方法及其系统。该方法的一具体实施方式包括:获取语音数字信号,对其进行语音活动检测,得到待识别语音段;定义自适应关键词匹配窗口,分割待识别语音段;对语音段进行特征提取,得到梅尔频率倒谱系数嵌入特征向量;分析自定义关键词列表,结合预先训练的音素补白模型,得到中文解码网络空间和英文解码网络空间;将所述梅尔频率倒谱系数嵌入特征向量依次输入所述解码网络空间中,得到识别结果;对识别结果后处理,生成目标识别结果。该实施方式的计算量低,可以离线识别,识别准确率高,响应速度快,支持中英文混合识别,能够灵活的更换关键词列表从而适应不同场景下的应用。
基本信息
专利标题 :
一种特定场景下的中英文混合的离线语音关键词识别方法及其系统实现
专利标题(英):
暂无
公开(公告)号 :
CN114530141A
申请号 :
CN202011323748.7
公开(公告)日 :
2022-05-24
申请日 :
2020-11-23
授权号 :
暂无
授权日 :
暂无
发明人 :
陆峰薛玉敏
申请人 :
北京航空航天大学
申请人地址 :
北京市海淀区学院路37号
代理机构 :
北京唯智勤实知识产权代理事务所(普通合伙)
代理人 :
陈佳
优先权 :
CN202011323748.7
主分类号 :
G10L15/00
IPC分类号 :
G10L15/00 G10L15/02 G10L15/08 G10L15/14 G10L15/183 G10L19/00 G10L25/24
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
法律状态
2022-06-10 :
实质审查的生效
IPC(主分类) : G10L 15/00
申请日 : 20201123
申请日 : 20201123
2022-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载