声学场景分类模型训练方法、装置、智能终端及存储介质

公开

摘要

本发明公开了声学场景分类模型训练方法、装置、智能终端及存储介质，所述方法包括：获取训练数据；提取所述样本音频的第一特征信号，并将所述第一特征信号进行切片和扩容后得到第二特征信号；将所述第二特征信号输入声学场景分类模型，输出预测声学场景类别；其中，所述声学场景分类模型通过对残差神经网络进行改进得到；根据所述预测声学场景类别和所述真实标签对所述声学场景分类模型进行训练，以得到已训练的声学场景分类模型。本发明实施例中通过对样本音频的特征信号进行切片后扩容，使得输入样本信号尺寸减小，并提升响应速度；将样本信号输入到改进的残差神经网络进行训练，使得模型的分类结果准确率更高。

基本信息

专利标题：

声学场景分类模型训练方法、装置、智能终端及存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114627895A

申请号：

CN202210319713.9

公开（公告）日：

2022-06-14

申请日：

2022-03-29

授权号：

暂无

授权日：

暂无

发明人：

谭钦王佳旭苗健彰

申请人：

大象声科（深圳）科技有限公司

申请人地址：

广东省深圳市南山区粤海街道高新区社区科技南路18号深圳湾科技生态园12栋裙楼533

代理机构：

深圳市君胜知识产权代理事务所(普通合伙)

代理人：

徐凯凯

优先权：

CN202210319713.9

主分类号：

G10L25/51

IPC分类号：

G10L25/51 G10L25/30 G06K9/62 G06N3/04 G06N3/08

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L25/00

不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术

G10L25/48

专门适用于特定用途

G10L25/51

比较或判别

法律状态

2022-06-14 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载