语音识别、网络模型的训练方法、装置、设备和存储介质

实质审查的生效

摘要

本申请提供了一种语音识别、网络模型的训练方法、装置、设备和存储介质，解决了现有技术中语音识别系统识别效果较差的问题。基于初始说话人波束和多路语音信号确定第一目标说话人波束，初始说话人波束基于多路语音信号的波束成形过程得到，第一目标说话人波束指示多路语音信号各自在初始说话人波束所在方向上的声音信息；基于第一目标说话人波束和多路语音信号确定噪声波束，噪声波束指示多路语音信号中除了第一目标说话人波束之外的声音信息；基于噪声波束和唤醒波束对第一目标说话人波束进行滤波，得到第二目标说话人波束，唤醒波束指示包含唤醒词的波束；对第二目标说话人波束进行语音识别，得到识别文本。

基本信息

专利标题：

语音识别、网络模型的训练方法、装置、设备和存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114283831A

申请号：

CN202111660465.6

公开（公告）日：

2022-04-05

申请日：

2021-12-30

授权号：

暂无

授权日：

暂无

发明人：

黄鑫许丽

申请人：

科大讯飞股份有限公司

申请人地址：

安徽省合肥市高新区望江西路666号

代理机构：

北京布瑞知识产权代理有限公司

代理人：

王海臣

优先权：

CN202111660465.6

主分类号：

G10L21/0208

IPC分类号：

G10L21/0208 G10L15/26 G10L15/065 G10L15/06 G10L25/21 G10L25/06

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L21/00

为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号

G10L21/02

语音增强，例如降低噪声或消除回声

G10L21/0208

噪声过滤

法律状态

2022-04-22 ：

实质审查的生效

IPC(主分类) : G10L 21/0208
申请日 : 20211230

2022-04-05 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载