一种基于残差注意力Transformer的光学乐谱图像识...
公开
摘要
本发明提出了一种基于残差注意力Transformer的神经网络方法用于光学乐谱图像识别。该识别过程的步骤为:通过建立基于残差注意力Transformer的乐谱图像识别模型,提取乐谱图像中的音符序列特征;根据捕获的音符序列特征,将乐谱图像中的音符序列数字化。本发明采用预训练的浅层残差卷积神经网络初始化参数,并提取音符基本特征,接着利用循环神经网络对获得的音符特征和标签序列分别进行编码和解码,提取音符序列的关联信息;而基于残差注意力Transformer结构,对重点关注区域加强关注,抑制无关区域的关注,进一步提取音符序列上下文特征;同时,当训练模型时,使用并行计算的统一掩码语言模型,有效地降低了音符序列错误率,缩短了模型训练时间。
基本信息
专利标题 :
一种基于残差注意力Transformer的光学乐谱图像识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114359946A
申请号 :
CN202111522531.3
公开(公告)日 :
2022-04-15
申请日 :
2021-12-14
授权号 :
暂无
授权日 :
暂无
发明人 :
温翠红朱龙娇刘嘉怡
申请人 :
湖南师范大学
申请人地址 :
湖南省长沙市岳麓区麓山路36号
代理机构 :
代理人 :
优先权 :
CN202111522531.3
主分类号 :
G06V30/42
IPC分类号 :
G06V30/42 G06V30/413 G06V10/82 G06V10/764 G06N3/04 G06N3/08 G06K9/62
法律状态
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载