一种基于深度学习的多声部音乐人声主旋律提取方法
公开
摘要

一种基于深度学习的多声部音乐人声主旋律提取方法,涉及深度学习领域和音频信号处理领域。包括以下步骤:1)基于音高显著性的多声部音乐音频信号预处理:利用显著性函数中谐波求和,通过频谱图分析、相位谱计算、显著性图谱计算、归一化处理的步骤获得输入神经网络的数据特征;2)基于多分类神经网络进行音高估算:将步骤1)预处理方法中得出的显著性图谱作为神经网络的输入,通过一个用于分类的神经网络来估算逐帧的音高。集合传统方法中对音频特征分析的优势,能较好地提取出音频的音高显著性特征,同时结合深度学习的先进方法,搭建神经网络训练模型,在预测结果时比传统的计算方法要更加快速高效。

基本信息
专利标题 :
一种基于深度学习的多声部音乐人声主旋律提取方法
专利标题(英):
暂无
公开(公告)号 :
CN114627892A
申请号 :
CN202210271946.6
公开(公告)日 :
2022-06-14
申请日 :
2022-03-18
授权号 :
暂无
授权日 :
暂无
发明人 :
陈彦如冯寅
申请人 :
厦门大学
申请人地址 :
福建省厦门市思明区思明南路422号
代理机构 :
厦门南强之路专利事务所(普通合伙)
代理人 :
马应森
优先权 :
CN202210271946.6
主分类号 :
G10L25/30
IPC分类号 :
G10L25/30  G10L25/90  G06N3/08  G06N3/04  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L25/00
不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术
G10L25/27
以分析方法为特征的
G10L25/30
利用神经网络
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332