语音识别模型的训练方法、语音识别方法和系统

授权

摘要

本发明实施例公开了一种语音识别模型的训练方法、语音识别方法和系统，涉及语音识别技术领域。该实施例包括：将音频训练样本输入声学编码器，对音频训练样本进行编码表示，确定声学编码状态向量；将预设的词表输入语言预测器中，确定文本预测向量；将文本预测向量线输入文本映射层，得到文本输出概率分布；根据音频训练样本对应的目标文本序列和文本输出概率分布，计算第一损失函数；将文本预测向量和声学编码状态向量输入联合网络，计算第二损失函数，根据第一损失函数和第二损失函数进行迭代优化，直至满足停止条件。本实施例对语音识别模型的训练、预测过程进行了调整，提高了该语义识别模型的建模能力，从而提高了该语音识别模型的准确率。

基本信息

专利标题：

语音识别模型的训练方法、语音识别方法和系统

专利标题（英）：

暂无

公开（公告）号：

CN113936647A

申请号：

CN202111548060.3

公开（公告）日：

2022-01-14

申请日：

2021-12-17

授权号：

CN113936647B

授权日：

2022-04-01

发明人：

陶建华田正坤易江燕

申请人：

中国科学院自动化研究所

申请人地址：

北京市海淀区中关村东路95号

代理机构：

北京华夏泰和知识产权代理有限公司

代理人：

李永叶

优先权：

CN202111548060.3

主分类号：

G10L15/06

IPC分类号：

G10L15/06 G10L15/22 G10L15/26 G10L19/16 G10L25/03 G10L25/24