一种音频分类方法和装置以及设备
实质审查的生效
摘要
本发明公开了一种音频分类方法和装置以及设备。其中,所述方法包括:计算每段长度为L=N1/1段的音频段的2n点的快速傅里叶变换值,并计算该快速傅里叶变换值的最大值Fmax,其中,该n为正整数,和根据该快速傅里叶变换值的最大值Fmax,计算该长度为N1的音频信号中的快速傅里叶变换值大于n2Fmax的音频段,其中,n2为大于0和小于1的数值,其中,0<n1<1的帧数为a2,以及根据该a1、a2的大小,输出该每段长度为L=N1/1段的音频段的分类类别。通过上述方式,能够实现通过去除该得到的端点检测后的音频数据的首尾能量低的音频段,得到长度为N1的音频信号,和将该长度为N1的音频信号分段为长度为L=N1/1段的音频段来进行音频分类的方式,提高对音频进行分类的准确率。
基本信息
专利标题 :
一种音频分类方法和装置以及设备
专利标题(英):
暂无
公开(公告)号 :
CN114333801A
申请号 :
CN202111649604.5
公开(公告)日 :
2022-04-12
申请日 :
2021-12-30
授权号 :
暂无
授权日 :
暂无
发明人 :
陈剑超肖龙源李稀敏蔡振华刘晓葳
申请人 :
厦门快商通科技股份有限公司
申请人地址 :
福建省厦门市软件园三期诚毅北大街63号1301单元
代理机构 :
厦门原创专利事务所(普通合伙)
代理人 :
高巍
优先权 :
CN202111649604.5
主分类号 :
G10L15/08
IPC分类号 :
G10L15/08 G10L15/05 G10L15/04 G10L25/21
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/08
语音分类或检索
法律状态
2022-04-29 :
实质审查的生效
IPC(主分类) : G10L 15/08
申请日 : 20211230
申请日 : 20211230
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载