一种基于深度学习的野生动物弱监督声音识别方法

实质审查的生效

摘要

一种基于深度学习的野生动物弱监督声音识别方法，涉及野生动物声音识别领域，包括：声音识别模型训练：获取包含野生动物图像及声音的视频集合；提取视频中的图像帧序列及对应的音频；利用深度学习网络对图像帧进行识别得到类别属性标签；将音频时域数据转换为频域数据；创建训练数据库；利用类别属性标签及频域数据进行声音识别模型训练；声音识别模型推理：获取只含有野生动物声音的视频集合；提取视频中的音频数据；将音频时域数据转换为频域数据；利用声音识别模型对频域数据进行识别得到最终的类别属性标签。本发明降低了样本标注成本，采用深度学习方法，无需人工筛选特征模板，提高了准确率和识别效率。

基本信息

专利标题：

一种基于深度学习的野生动物弱监督声音识别方法

专利标题（英）：

暂无

公开（公告）号：

CN114420138A

申请号：

CN202210035265.X

公开（公告）日：

2022-04-29

申请日：

2022-01-13

授权号：

暂无

授权日：

暂无

发明人：

王金龙蔡宇黄艳金

申请人：

中林信达（北京）科技信息有限责任公司

申请人地址：

北京市东城区青龙胡同1号6层609

代理机构：

长春众邦菁华知识产权代理有限公司

代理人：

于晓庆

优先权：

CN202210035265.X

主分类号：

G10L17/26

IPC分类号：

G10L17/26 G10L19/02 G10L25/30 G06F17/14 G06N3/04 G06N3/08

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L17/00

讲话者辨认或验证

G10L17/26

特殊语音特征的识别，例如测谎器的使用；动物声音识别

法律状态

2022-05-20 ：

实质审查的生效

IPC(主分类) : G10L 17/26
申请日 : 20220113

2022-04-29 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载