一种基于深度学习的野生动物弱监督声音识别方法
实质审查的生效
摘要

一种基于深度学习的野生动物弱监督声音识别方法,涉及野生动物声音识别领域,包括:声音识别模型训练:获取包含野生动物图像及声音的视频集合;提取视频中的图像帧序列及对应的音频;利用深度学习网络对图像帧进行识别得到类别属性标签;将音频时域数据转换为频域数据;创建训练数据库;利用类别属性标签及频域数据进行声音识别模型训练;声音识别模型推理:获取只含有野生动物声音的视频集合;提取视频中的音频数据;将音频时域数据转换为频域数据;利用声音识别模型对频域数据进行识别得到最终的类别属性标签。本发明降低了样本标注成本,采用深度学习方法,无需人工筛选特征模板,提高了准确率和识别效率。

基本信息
专利标题 :
一种基于深度学习的野生动物弱监督声音识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114420138A
申请号 :
CN202210035265.X
公开(公告)日 :
2022-04-29
申请日 :
2022-01-13
授权号 :
暂无
授权日 :
暂无
发明人 :
王金龙蔡宇黄艳金
申请人 :
中林信达(北京)科技信息有限责任公司
申请人地址 :
北京市东城区青龙胡同1号6层609
代理机构 :
长春众邦菁华知识产权代理有限公司
代理人 :
于晓庆
优先权 :
CN202210035265.X
主分类号 :
G10L17/26
IPC分类号 :
G10L17/26  G10L19/02  G10L25/30  G06F17/14  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L17/00
讲话者辨认或验证
G10L17/26
特殊语音特征的识别,例如测谎器的使用;动物声音识别
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : G10L 17/26
申请日 : 20220113
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332