基于U-Net模型的缺失音频自动修复方法
实质审查的生效
摘要

本发明公开了一种基于U‑Net模型的缺失音频自动修复方法,包括以下内容:将音频信号处理为长度相同的样本并构建多样音频数据集;将所有音频样本处理成固定长度的三部分,从左到右分别为左侧上下文部分、间隙部分以及右侧上下文部分;利用短时傅里叶变换将音频上下文部分和间隙部分都转化为频谱图;深度学习模型中的编码器对上下文部分的频谱图进行特征学习,解码器实现间隙部分缺失音频的自动修复,跳跃连接将两个相应层相连以扩大网络接收范围,提高网络修复性能;最后使用局部加权求和策略将生成的频谱图转换为音频信号。本发明利用U‑Net深度学习模型和局部加权求和策略来对缺失音频进行修复,修复效果好,而且计算成本较低,适用于短音频中音频缺失情况的修复。

基本信息
专利标题 :
基于U-Net模型的缺失音频自动修复方法
专利标题(英):
暂无
公开(公告)号 :
CN114373469A
申请号 :
CN202011105942.8
公开(公告)日 :
2022-04-19
申请日 :
2020-10-15
授权号 :
暂无
授权日 :
暂无
发明人 :
葛书敏刘伟伟刘光杰
申请人 :
南京理工大学
申请人地址 :
江苏省南京市孝陵卫200号
代理机构 :
南京理工大学专利中心
代理人 :
王玮
优先权 :
CN202011105942.8
主分类号 :
G10L19/02
IPC分类号 :
G10L19/02  G10L25/18  G10L25/27  G06F17/14  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L19/00
用于冗余度下降情形的语音或音频信号分析-合成技术;语音或音频信号编码或解码,采用源滤波器模型或心理声学分析
G10L19/02
利用频谱分析,例如变换声码器或子频带声码器
法律状态
2022-05-06 :
实质审查的生效
IPC(主分类) : G10L 19/02
申请日 : 20201015
2022-04-19 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332