语音识别模型的训练方法、语音识别方法和系统
授权
摘要

本发明实施例公开了一种语音识别模型的训练方法、语音识别方法和系统,涉及语音识别技术领域。该实施例包括:将音频训练样本输入声学编码器,对音频训练样本进行编码表示,确定声学编码状态向量;将预设的词表输入语言预测器中,确定文本预测向量;将文本预测向量线输入文本映射层,得到文本输出概率分布;根据音频训练样本对应的目标文本序列和文本输出概率分布,计算第一损失函数;将文本预测向量和声学编码状态向量输入联合网络,计算第二损失函数,根据第一损失函数和第二损失函数进行迭代优化,直至满足停止条件。本实施例对语音识别模型的训练、预测过程进行了调整,提高了该语义识别模型的建模能力,从而提高了该语音识别模型的准确率。

基本信息
专利标题 :
语音识别模型的训练方法、语音识别方法和系统
专利标题(英):
暂无
公开(公告)号 :
CN113936647A
申请号 :
CN202111548060.3
公开(公告)日 :
2022-01-14
申请日 :
2021-12-17
授权号 :
CN113936647B
授权日 :
2022-04-01
发明人 :
陶建华田正坤易江燕
申请人 :
中国科学院自动化研究所
申请人地址 :
北京市海淀区中关村东路95号
代理机构 :
北京华夏泰和知识产权代理有限公司
代理人 :
李永叶
优先权 :
CN202111548060.3
主分类号 :
G10L15/06
IPC分类号 :
G10L15/06  G10L15/22  G10L15/26  G10L19/16  G10L25/03  G10L25/24  
相关图片
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/06
创建基准模板;训练语音识别系统,例如对说话者声音特征的适应
法律状态
2022-04-01 :
授权
2022-02-01 :
实质审查的生效
IPC(主分类) : G10L 15/06
申请日 : 20211217
2022-01-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN113936647A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332