一种端到端的骨气导语音联合识别方法

实质审查的生效

摘要

本发明公开了一种端到端的骨气导语音联合识别方法，首先获取同步的气导和骨传导语音数据构建数据集，输出为对应的文本；再对气导和骨传导语音信号进行数据增强和提取声学特征；然后搭建基于Conformer的端到端深度神经网络模型，由三部分构成，分别为处理气导和骨传导语音的两个分支网络，以及基于多模态Transducer的融合网络；接下来训练神经网络，最终通过训练完成的网络得到对应的识别结果。本发明相比传统的只利用气导语音信号进行语音识别，联合识别的方法可以使得语音识别的错误率显著下降，提升了系统整体的识别性能。

基本信息

专利标题：

一种端到端的骨气导语音联合识别方法

专利标题（英）：

暂无

公开（公告）号：

CN114495909A

申请号：

CN202210153909.5

公开（公告）日：

2022-05-13

申请日：

2022-02-20

授权号：

暂无

授权日：

暂无

发明人：

王谋陈俊淇张晓雷王逸平

申请人：

西北工业大学

申请人地址：

陕西省西安市友谊西路127号

代理机构：

西北工业大学专利中心

代理人：

金凤

优先权：

CN202210153909.5

主分类号：

G10L15/02

IPC分类号：

G10L15/02 G10L15/06 G10L15/16 G10L15/20 G10L15/26

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/02

语音识别的特征提取；识别单位的选择

法律状态

2022-05-31 ：

实质审查的生效

IPC(主分类) : G10L 15/02
申请日 : 20220220

2022-05-13 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载