一种基于深度学习的智能语音识别方法和系统

公开

摘要

本发明提出了一种基于深度学习的智能语音识别方法，首先获取语音信息；采用融合的噪声消除模型对获取的语音信息，进行噪声消除，得到消噪后的语音信息，所述融合的噪声消除模型为结合语音端点检测算法对两个噪声消除模型融合得到；将消噪后的语音信息，输入阶段式学习增强网络结构，得到增强后的语音信息；所述阶段式学习增强网络结构包括多个目标层，目标层采用线性激活函数，隐含层为LSTM‑RNN网络；将增强后的语音信息输输入语音模型中进行语音识别；本发明提供的方法，能够消除噪声的同时又能保留必要的目标语音，提升对各种复杂环境的语音增强的鲁棒性，运算量小。

基本信息

专利标题：

一种基于深度学习的智能语音识别方法和系统

专利标题（英）：

暂无

公开（公告）号：

CN114299938A

申请号：

CN202210214027.5

公开（公告）日：

2022-04-08

申请日：

2022-03-07

授权号：

暂无

授权日：

暂无

发明人：

任国斌

申请人：

凯新创达（深圳）科技发展有限公司

申请人地址：

广东省深圳市宝安区石岩街道浪心社区塘头大道196号B座19层-20层

代理机构：

深圳市创富知识产权代理有限公司

代理人：

曾敬

优先权：

CN202210214027.5

主分类号：

G10L15/16

IPC分类号：

G10L15/16 G10L15/06 G10L21/0208 G10L25/87 G06N3/04 G06N3/08

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/08

语音分类或检索

G10L15/16

利用人工神经网络

法律状态

2022-04-08 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载