基于语言种类和语音内容协同分类的多语言语音识别方法

授权

摘要

本发明公开了基于语言种类和语音内容协同分类的多语言语音识别方法，所述方法包括：步骤1)建立和训练语言种类和语音内容协同分类声学模型；该声学模型融合了包含语种相关信息的语种特征向量，在多语言识别过程中能够利用语种特征向量对特定语种的音素分类层做模型自适应优化；步骤2)将待识别的语音特征序列输入训练好的语言种类和语音内容协同分类声学模型，输出特征序列对应的音素后验概率分布；解码器结合特征的序列音素后验概率分布生成若干个候选词序列和其对应的声学模型得分；步骤3)将候选词序列的声学模型得分和语言模型得分进行结合作为总体分数，将总体分数最高的候选词序列作为特定语言的语音内容的识别结果。

基本信息

专利标题：

基于语言种类和语音内容协同分类的多语言语音识别方法

专利标题（英）：

暂无

公开（公告）号：

CN110895932A

申请号：

CN201810974049.5

公开（公告）日：

2020-03-20

申请日：

2018-08-24

授权号：

CN110895932B

授权日：

2022-05-03

发明人：

徐及刘丹阳张鹏远颜永红

申请人：

中国科学院声学研究所;北京中科信利技术有限公司

申请人地址：

北京市海淀区北四环西路21号

代理机构：

北京方安思达知识产权代理有限公司

代理人：

陈琳琳

优先权：

CN201810974049.5

主分类号：

G10L15/06

IPC分类号：

G10L15/06 G10L15/00 G10L15/08