语音识别模型的处理方法、语音识别方法及装置
公开
摘要

本申请涉及一种语音识别模型的处理方法、语音识别方法及装置。上述方法涉及人工智能领域的语音识别技术,包括:通过语音识别模型得到样本信号对应的语音特征,以及基于语音特征输出的第一预测字符序列;将标注字符序列对应的前向字符序列输入解码器,前向字符序列是基于标注字符序列中各字符的前一字符生成的;在解码器中,根据前向字符序列对应的语义特征对语音特征进行解码获得语音语义联合特征,基于语音语义联合特征获得第二预测字符序列;基于根据标注字符序列与第一预测字符序列计算的语音识别损失,以及根据标注字符序列与第二预测字符序列计算的语义识别损失,联合训练语音识别模型与解码器。采用本方法能够提升语音识别准确率。

基本信息
专利标题 :
语音识别模型的处理方法、语音识别方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN114360502A
申请号 :
CN202111292319.2
公开(公告)日 :
2022-04-15
申请日 :
2021-11-03
授权号 :
暂无
授权日 :
暂无
发明人 :
邓克琦曹松军马龙
申请人 :
腾讯科技(深圳)有限公司
申请人地址 :
广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构 :
华进联合专利商标代理有限公司
代理人 :
郑义
优先权 :
CN202111292319.2
主分类号 :
G10L15/02
IPC分类号 :
G10L15/02  G10L15/06  G10L15/18  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/02
语音识别的特征提取;识别单位的选择
法律状态
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332