一种用于语音识别的热词增强方法、设备及介质
公开
摘要
本申请公开了一种用于语音识别的热词增强方法、设备及介质。方法包括:通过编码器获取热词的音频文件,并根据音频文件提取特征,将提取的特征发送至CTC解码器,以通过CTC解码器获得流式识别结果;将流式识别结果输入至语言模型进行浅融合,以根据前缀树对识别结果进行偏置,得到搜索图;通过WFST进行浅融合,以根据搜索图获取最佳路径,将最佳路径发送至注意力解码器,通过注意力解码器获得精确结果,以完成对热词的增强。本申请通过WFST的浅融合、基于前缀树的深度偏置和语言模型相结合的热词增强方法,提高了对域外(OOD)音频的识别准确率。热词的识别准确率得到明显的提升。
基本信息
专利标题 :
一种用于语音识别的热词增强方法、设备及介质
专利标题(英):
暂无
公开(公告)号 :
CN114564564A
申请号 :
CN202210180247.0
公开(公告)日 :
2022-05-31
申请日 :
2022-02-25
授权号 :
暂无
授权日 :
暂无
发明人 :
尹青山宋虎王建华高明
申请人 :
山东新一代信息产业技术研究院有限公司
申请人地址 :
山东省济南市高新区港兴三路北段未来创业广场3号楼11-12层
代理机构 :
北京君慧知识产权代理事务所(普通合伙)
代理人 :
董延丽
优先权 :
CN202210180247.0
主分类号 :
G06F16/33
IPC分类号 :
G06F16/33 G06F16/35 G06F16/31 G06F40/126
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/33
••查询
法律状态
2022-05-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载