基于深度学习网络的钢琴乐音分割及音符识别算法
公开
摘要
本发明公开了一种基于深度学习网络的钢琴乐音分割及音符识别算法,包括步骤:基于循环神经网络,从一段连续的钢琴音频中得到每个单音的起始点;根据每个单音的起始点,将完整的钢琴音频信号分割为若干个单音音频;构建音高识别的音频数据集;对音频数据集中的信号进行预处理,绘制变换后的语谱图,同时依据各基频的频带对语谱图进行分割得到子语谱图;将语谱图分割得到的多个子语谱图作为输入,通过多个卷积神经网络进行音高的识别。本发明相较于传统的时域方法,不再依赖阈值的选取,提高了泛化能力,相较于传统的频域方法,简化了计算过程,提高了运行速度。
基本信息
专利标题 :
基于深度学习网络的钢琴乐音分割及音符识别算法
专利标题(英):
暂无
公开(公告)号 :
CN114627893A
申请号 :
CN202210209245.X
公开(公告)日 :
2022-06-14
申请日 :
2022-03-03
授权号 :
暂无
授权日 :
暂无
发明人 :
兰智杰张丹阳郭玲
申请人 :
南京理工大学
申请人地址 :
江苏省南京市孝陵卫200号
代理机构 :
南京理工大学专利中心
代理人 :
段宇轩
优先权 :
CN202210209245.X
主分类号 :
G10L25/51
IPC分类号 :
G10L25/51 G10L25/90 G06N3/04 G06N3/08 G10L25/18 G10L25/30 G10L25/45
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L25/00
不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术
G10L25/48
专门适用于特定用途
G10L25/51
比较或判别
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载