语音识别系统的训练方法和装置、语音识别方法和装置
实质审查的生效
摘要
本申请实施例提供了一种语音识别系统的训练方法和装置、语音识别方法和装置,应用于语音识别技术领域。该方法包括:对目标说话人的音频数据进行关键特征提取,得到音频数据的声学特征;根据声学特征和预设的训练样本集,提取训练样本集的声纹特征;将声学特征和声纹特征合并,得到融合声纹特征;基于训练样本集和融合声纹特征训练声学模型的卷积神经网络模块,得到训练后的声学模型;依据训练样本集对已构建的语言模型进行训练,得到训练后的语言模型。本申请实施例实现了声纹特征自适应的语音识别系统的训练,解决了现有技术语音识别准确率不高的问题。
基本信息
专利标题 :
语音识别系统的训练方法和装置、语音识别方法和装置
专利标题(英):
暂无
公开(公告)号 :
CN114550703A
申请号 :
CN202011334340.X
公开(公告)日 :
2022-05-27
申请日 :
2020-11-24
授权号 :
暂无
授权日 :
暂无
发明人 :
韦强申孟祥德宋勇刘志勇
申请人 :
亚信科技(中国)有限公司
申请人地址 :
北京市海淀区西北旺东路10号院东区19号楼1层101
代理机构 :
北京市立方律师事务所
代理人 :
张筱宁
优先权 :
CN202011334340.X
主分类号 :
G10L15/06
IPC分类号 :
G10L15/06 G10L15/02 G10L17/04 G10L17/02 G10L25/24 G10L25/30 G10L25/45
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/06
创建基准模板;训练语音识别系统,例如对说话者声音特征的适应
法律状态
2022-06-14 :
实质审查的生效
IPC(主分类) : G10L 15/06
申请日 : 20201124
申请日 : 20201124
2022-05-27 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载