语音识别模型训练方法、语言识别方法及电子设备

公开

摘要

本公开是关于一种语音识别模型训练方法、语音识别方法、语音识别模型训练装置、语音识别装置及电子设备。该语音识别模型训练方法包括：基于预先确定的多通道训练数据对预设的神经网络模型进行训练，得到第一模型；基于第一模型确定出与实际场景匹配的多通道仿真数据；基于多通道训练数据以及与实际场景匹配的多通道仿真数据训练第一模型得到第二模型。本申请中采用单通道训练数据扩增多通道仿真数据的方式来增加训练数据，选取与实际场景匹配的仿真数据作为训练第二模型的训练数据。如此不仅解决了多通道训练数据不足的问题，同时优化了多通道仿真数据使得用于训练的多通道仿真数据与语音识别的实际场景更加匹配，提高训练模型的语言识别性能。

基本信息

专利标题：

语音识别模型训练方法、语言识别方法及电子设备

专利标题（英）：

暂无

公开（公告）号：

CN114582327A

申请号：

CN202210177157.6

公开（公告）日：

2022-06-03

申请日：

2022-02-25

授权号：

暂无

授权日：

暂无

发明人：

梁玉权王全东郭理勇孔玉祥高鹏

申请人：

北京小米移动软件有限公司;北京小米松果电子有限公司

申请人地址：

北京市海淀区西二旗中路33号院6号楼8层018号

代理机构：

北京善任知识产权代理有限公司

代理人：

董超男

优先权：

CN202210177157.6

主分类号：

G10L15/06

IPC分类号：

G10L15/06 G10L15/16 G10L15/18

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/06

创建基准模板；训练语音识别系统，例如对说话者声音特征的适应

法律状态

2022-06-03 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载