基于非自回归模型的语音识别方法及相关设备
实质审查的生效
摘要

本申请实施例属于人工智能领域,涉及一种语音识别方法,包括:将待识别的语音信号输入到编码器中得到语音信号的编码比特流,采用CTC损失函数为目标函数进行训练,将训练后的编码比特流作为编码器的输出;将编码器的输出输入到第一层解码器,除第一层解码器外的第K层解码器以第K‑1层解码器的输出作为输入,每一层解码器均采用CTC损失函数进行训练,并经过归一化指数函数处理得到每一层解码器的输出,最后一层解码器的输出作为解码器的整体输出;基于解码器的整体输出,采用交叉熵损失函数进行训练,得到语音识别结果。本申请还提供一种语音识别装置、计算机设备及存储介质。本申请能够改善语音识别的运行结果。

基本信息
专利标题 :
基于非自回归模型的语音识别方法及相关设备
专利标题(英):
暂无
公开(公告)号 :
CN114420107A
申请号 :
CN202210036528.9
公开(公告)日 :
2022-04-29
申请日 :
2022-01-12
授权号 :
暂无
授权日 :
暂无
发明人 :
张之勇王健宗
申请人 :
平安科技(深圳)有限公司
申请人地址 :
广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
代理机构 :
深圳市世联合知识产权代理有限公司
代理人 :
刘畅
优先权 :
CN202210036528.9
主分类号 :
G10L15/06
IPC分类号 :
G10L15/06  G10L15/08  G10L25/27  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/06
创建基准模板;训练语音识别系统,例如对说话者声音特征的适应
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : G10L 15/06
申请日 : 20220112
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332