在线音频分类方法、装置及计算机设备
实质审查的生效
摘要
本申请涉及音频互动领域和网络直播领域,提出一种在线音频分类方法、装置及计算机设备,该方法包括:获取在线音频信号;提取在线音频信号对应的第一音频特征图;将在线音频信号对应的第一音频特征图输入至预训练好的音频分类模型,得到在线音频信号的分类结果;其中,预训练好的音频分类模型中包括若干个音频分类模块,每个音频分类模块中包括至少一个自注意力模块,自注意力模块用于对音频特征图进行时序维度和频率维度上的远距离特征融合。相对于现有技术,本申请考虑到在线音频信号其语义与时序相关性较强且语义较为复杂的特点,使用自注意力模块对音频特征图进行时序维度和频率维度上的远距离特征融合,提高了在线音频分类结果的准确性。
基本信息
专利标题 :
在线音频分类方法、装置及计算机设备
专利标题(英):
暂无
公开(公告)号 :
CN114333908A
申请号 :
CN202111643298.4
公开(公告)日 :
2022-04-12
申请日 :
2021-12-29
授权号 :
暂无
授权日 :
暂无
发明人 :
陈广陈增海郑康元王璞
申请人 :
广州方硅信息技术有限公司
申请人地址 :
广东省广州市番禺区南村镇万博二路79号3108
代理机构 :
广州骏思知识产权代理有限公司
代理人 :
潘桂生
优先权 :
CN202111643298.4
主分类号 :
G10L25/51
IPC分类号 :
G10L25/51 G06K9/00 G06K9/62 G06N3/04 G06N3/08 G10L25/03 G10L25/18 G10L25/30
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L25/00
不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术
G10L25/48
专门适用于特定用途
G10L25/51
比较或判别
法律状态
2022-04-29 :
实质审查的生效
IPC(主分类) : G10L 25/51
申请日 : 20211229
申请日 : 20211229
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载