语音识别系统的训练方法和装置、语音识别方法和装置

实质审查的生效

摘要

本申请实施例提供了一种语音识别系统的训练方法和装置、语音识别方法和装置，应用于语音识别技术领域。该方法包括：对目标说话人的音频数据进行关键特征提取，得到音频数据的声学特征；根据声学特征和预设的训练样本集，提取训练样本集的声纹特征；将声学特征和声纹特征合并，得到融合声纹特征；基于训练样本集和融合声纹特征训练声学模型的卷积神经网络模块，得到训练后的声学模型；依据训练样本集对已构建的语言模型进行训练，得到训练后的语言模型。本申请实施例实现了声纹特征自适应的语音识别系统的训练，解决了现有技术语音识别准确率不高的问题。

基本信息

专利标题：

语音识别系统的训练方法和装置、语音识别方法和装置

专利标题（英）：

暂无

公开（公告）号：

CN114550703A

申请号：

CN202011334340.X

公开（公告）日：

2022-05-27

申请日：

2020-11-24

授权号：

暂无

授权日：

暂无

发明人：

韦强申孟祥德宋勇刘志勇

申请人：

亚信科技（中国）有限公司

申请人地址：

北京市海淀区西北旺东路10号院东区19号楼1层101

代理机构：

北京市立方律师事务所

代理人：

张筱宁

优先权：

CN202011334340.X

主分类号：

G10L15/06

IPC分类号：

G10L15/06 G10L15/02 G10L17/04 G10L17/02 G10L25/24 G10L25/30 G10L25/45

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/06

创建基准模板；训练语音识别系统，例如对说话者声音特征的适应

法律状态

2022-06-14 ：

实质审查的生效

IPC(主分类) : G10L 15/06
申请日 : 20201124

2022-05-27 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载