一种基于Conformer建模的语音超分辨率方法
公开
摘要

本发明公开了一种基于Conformer建模的语音超分辨率方法,该方法包括:将语音重采样到窄带带宽,经过快速傅里叶变换,转换到频域,截去高频频谱部分,保留空白的高频频谱部分再进行重采样得到与宽带语音采样率一致的窄带语音以6:2:2的比例划分数据集为训练集,验证集和测试集;将训练集的语音分帧后输入进卷积层以提取其特征,并将提取的特征输入Conformer声学模型进行迭代训练;将T‑F loss作为模型的训练损失函数,使用Adam优化器进行优化;把固定训练周期的模型在验证集上进行测试,以调节模型超参数;将最终训练好的模型在测试集上进行测试,以验证模型的最终性能。本发明可以有效的提高语音或音乐信号的超分辨率,提高低分率语音的整体音质。

基本信息
专利标题 :
一种基于Conformer建模的语音超分辨率方法
专利标题(英):
暂无
公开(公告)号 :
CN114596869A
申请号 :
CN202210210778.X
公开(公告)日 :
2022-06-07
申请日 :
2022-03-04
授权号 :
暂无
授权日 :
暂无
发明人 :
许春冬朱诚
申请人 :
江西理工大学
申请人地址 :
江西省赣州市红旗大道86号
代理机构 :
温州知远专利代理事务所(特殊普通合伙)
代理人 :
汤时达
优先权 :
CN202210210778.X
主分类号 :
G10L21/007
IPC分类号 :
G10L21/007  G10L25/30  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L21/00
为了改变语音或声音信号的质量或其可识度而处理语音或声音信号,以产生另一种可听的或非可听的信号,例如视觉信号或触觉信号
G10L21/003
改变声音质量,例如音调或共振峰
G10L21/007
以所使用的处理为特征的
法律状态
2022-06-07 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332