一种基于离散基尼系数的音频指纹降维方法
授权
摘要
本发明涉及一种基于离散基尼系数计算的音频指纹降维方法,旨在解决音频指纹特征维度高的问题,具体包括分类构建目标声音库、提取样本音频的指纹特征、引入离散基尼系数对音频指纹特征进行降维。本发明在音频指纹各维度引入指纹离散基尼系数,通过音频指纹各维度的离散基尼系数大小反映出不同音频在该维的区分性大小,通过保留离散基尼系数大的维度,删除离散基尼系数小的维度达到降维的目的。通过降维后的音频指纹特征构建的样本音频指纹库数据量更小、利用率更高。
基本信息
专利标题 :
一种基于离散基尼系数的音频指纹降维方法
专利标题(英):
暂无
公开(公告)号 :
CN110600038A
申请号 :
CN201910784077.5
公开(公告)日 :
2019-12-20
申请日 :
2019-08-23
授权号 :
CN110600038B
授权日 :
2022-04-05
发明人 :
贾懋珅赵文兵
申请人 :
北京工业大学
申请人地址 :
北京市朝阳区平乐园100号
代理机构 :
北京思海天达知识产权代理有限公司
代理人 :
吴荫芳
优先权 :
CN201910784077.5
主分类号 :
G10L17/00
IPC分类号 :
G10L17/00 G10L17/02 G10L17/04 G10L17/08 G10L17/14 G10L21/0208 G10L25/54
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L17/00
讲话者辨认或验证
法律状态
2022-04-05 :
授权
2020-01-14 :
实质审查的生效
IPC(主分类) : G10L 17/00
申请日 : 20190823
申请日 : 20190823
2019-12-20 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载