一种基于降噪自动编码器的语种识别分类方法及装置

授权

摘要

本发明提供一种基于降噪自动编码器的语种识别分类方法，其包括：步骤1)从待识别的语音片段中提取待识别的语音信号，获得底层声学特征；步骤2)从步骤1)获得的底层声学特征提取原始i‑vector；步骤3)计算并获得音素向量p_c(u)；步骤4)将原始i‑vector与音素向量p_c(u)进行拼接，将其输入至基于DAE的i‑vector补偿网络，获得补偿后的i‑vector；步骤5)分别将步骤2)获得的原始i‑vector和步骤4)获得的补偿后的i‑vector输入至预先训练的逻辑回归分类器，获得对应的分数向量；步骤6)对步骤5)获得的对应的分数向量，进行分数融合，得到最终的分数向量，进而得到各个语种类别的概率，并判定所属的语种类别。

基本信息

专利标题：

一种基于降噪自动编码器的语种识别分类方法及装置

专利标题（英）：

暂无

公开（公告）号：

CN110858477A

申请号：

CN201810916756.9

公开（公告）日：

2020-03-03

申请日：

2018-08-13

授权号：

CN110858477B

授权日：

2022-05-03

发明人：

周若华苗晓晓颜永红

申请人：

中国科学院声学研究所;北京中科信利技术有限公司

申请人地址：

北京市海淀区北四环西路21号

代理机构：

北京方安思达知识产权代理有限公司

代理人：

陈琳琳

优先权：

CN201810916756.9

主分类号：

G10L15/00

IPC分类号：

G10L15/00 G10L15/02 G10L15/08

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

法律状态

2022-05-03 ：

授权

2020-03-27 ：

实质审查的生效

IPC(主分类) : G10L 15/00
申请日 : 20180813

2020-03-03 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载