一种端到端的骨气导语音联合识别方法
实质审查的生效
摘要
本发明公开了一种端到端的骨气导语音联合识别方法,首先获取同步的气导和骨传导语音数据构建数据集,输出为对应的文本;再对气导和骨传导语音信号进行数据增强和提取声学特征;然后搭建基于Conformer的端到端深度神经网络模型,由三部分构成,分别为处理气导和骨传导语音的两个分支网络,以及基于多模态Transducer的融合网络;接下来训练神经网络,最终通过训练完成的网络得到对应的识别结果。本发明相比传统的只利用气导语音信号进行语音识别,联合识别的方法可以使得语音识别的错误率显著下降,提升了系统整体的识别性能。
基本信息
专利标题 :
一种端到端的骨气导语音联合识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114495909A
申请号 :
CN202210153909.5
公开(公告)日 :
2022-05-13
申请日 :
2022-02-20
授权号 :
暂无
授权日 :
暂无
发明人 :
王谋陈俊淇张晓雷王逸平
申请人 :
西北工业大学
申请人地址 :
陕西省西安市友谊西路127号
代理机构 :
西北工业大学专利中心
代理人 :
金凤
优先权 :
CN202210153909.5
主分类号 :
G10L15/02
IPC分类号 :
G10L15/02 G10L15/06 G10L15/16 G10L15/20 G10L15/26
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/02
语音识别的特征提取;识别单位的选择
法律状态
2022-05-31 :
实质审查的生效
IPC(主分类) : G10L 15/02
申请日 : 20220220
申请日 : 20220220
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载