语音识别模型训练方法及语音识别方法

授权

摘要

本发明公开一种语音识别模型训练方法，包括：采用多语言样本集对语音识别模型进行预训练得到初始语音识别模型，所述多语言样本集中包括目标语言样本集；采用预先训练得到的语言分类器确定目标语言的后验概率；根据所述后验概率在基于所述多语言样本集进行训练过程中进行数据加权；至少根据数据加权结果训练所述初始语音识别模型；采用所述目标语言样本集对训练后的初始语音识别模型进行调整。本发明为了利用目标语言和源语言之间的相似性进行ASR训练，采用目标语言的后验概率对多语言样本集中的样本进行加权处理，从而在多语言数据集中找到与目标语言更相似的数据，以实现更好的适应性。

基本信息

专利标题：

语音识别模型训练方法及语音识别方法

专利标题（英）：

暂无

公开（公告）号：

CN113223506A

申请号：

CN202110591355.2

公开（公告）日：

2021-08-06

申请日：

2021-05-28

授权号：

CN113223506B

授权日：

2022-05-20

发明人：

钱彦旻周之恺王巍卢怡宙

申请人：

思必驰科技股份有限公司

申请人地址：

江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋

代理机构：

北京商专永信知识产权代理事务所(普通合伙)

代理人：

黄谦

优先权：

CN202110591355.2

主分类号：

G10L15/06

IPC分类号：

G10L15/06 G10L15/065