音频识别方法、装置、电子设备及计算机可读存储介质
公开
摘要

本申请实施例适用于人工智能技术领域,提供了一种音频识别方法、装置、电子设备及计算机可读存储介质,包括:对音频训练数据进行特征提取,得到声学特征;对声学特征进行分块处理,得到多个分块;根据音频训练数据的音频语义标签和多个分块确定若干分块标签对齐方式;其中,一种分块标签对齐方式用于表征多个分块与音频语义标签的一种对齐方式;根据若干分块标签对齐方式确定目标对齐概率,目标对齐概率用于查找对未完成训练的语音识别模型进行训练的训练数据。本申请实施例可以提高语音识别模型的识别精度。

基本信息
专利标题 :
音频识别方法、装置、电子设备及计算机可读存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114512117A
申请号 :
CN202011158866.7
公开(公告)日 :
2022-05-17
申请日 :
2020-10-26
授权号 :
暂无
授权日 :
暂无
发明人 :
余江凌
申请人 :
武汉TCL集团工业研究院有限公司
申请人地址 :
湖北省武汉市东湖新技术开发区高新大道999号未来科技大厦8层
代理机构 :
深圳中一联合知识产权代理有限公司
代理人 :
肖遥
优先权 :
CN202011158866.7
主分类号 :
G10L15/02
IPC分类号 :
G10L15/02  G10L15/06  G10L19/00  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/02
语音识别的特征提取;识别单位的选择
法律状态
2022-05-17 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332