音频开头爆音的检测方法、装置及存储介质
授权
摘要

本发明公开了一种音频开头爆音的检测方法、装置及存储介质,所述方法包括:获取训练样本,并对训练样本进行预处理,以获取多个不同尺度的音频子片段,然后将多个不同尺度的音频子片段输入第一参考模型中进行特征提取训练,以提取出多个不同尺度的特征图,再将多个不同尺度的特征图输入第二参考模型中进行特征融合训练,以得到特征融合参数,并根据多个不同尺度的特征图与特征融合参数生成检测模型,其中检测模型包括训练后的第一参考模型与第二参考模型,最后基于检测模型对待测音频进行音频开头爆音的检测,提升了音频开头爆音检测的准确率,能够有效检测音频的开头爆音。

基本信息
专利标题 :
音频开头爆音的检测方法、装置及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN109346102A
申请号 :
CN201811089089.8
公开(公告)日 :
2019-02-15
申请日 :
2018-09-18
授权号 :
CN109346102B
授权日 :
2022-05-06
发明人 :
王征韬
申请人 :
腾讯音乐娱乐科技(深圳)有限公司
申请人地址 :
广东省深圳市前海深港合作区前湾一路1号A栋201室
代理机构 :
深圳翼盛智成知识产权事务所(普通合伙)
代理人 :
黄威
优先权 :
CN201811089089.8
主分类号 :
G10L25/03
IPC分类号 :
G10L25/03  G10L25/27  G10L25/78  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L25/00
不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术
G10L25/03
以提取参数类型为特征的
法律状态
2022-05-06 :
授权
2019-03-12 :
实质审查的生效
IPC(主分类) : G10L 25/03
申请日 : 20180918
2019-02-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332