一种基于自注意力机制的通用图像目标检测方法和装置
授权
摘要

本发明公开一种基于自注意力机制的通用图像目标检测方法,该方法是基于DETR模型的改进,其包括对将含边界框标注的训练集图像输入图像特征提取网络,获得图像特征;将图像特征依次通过多头十字交叉注意力模块和多方向交叉注意力模块,获得解码器输出增强目标查询向量;将增强目标查询向量分别通过模型的分类层和回归层得到目标图像物体边界框和物体类别概率;计算网络整体损失对模型进行训练,得到目标检测模型;利用上述模型对待检测图像进行目标检测。本发明相比于DETR模型,在保证目标检测准确的同时,加快模型训练速度,减小模型的计算复杂度,提高模型灵活性与实用性。

基本信息
专利标题 :
一种基于自注意力机制的通用图像目标检测方法和装置
专利标题(英):
暂无
公开(公告)号 :
CN113902926A
申请号 :
CN202111477045.4
公开(公告)日 :
2022-01-07
申请日 :
2021-12-06
授权号 :
CN113902926B
授权日 :
2022-05-31
发明人 :
李特王世杰朱世强顾建军王兴刚
申请人 :
之江实验室
申请人地址 :
浙江省杭州市余杭区文一西路1818号
代理机构 :
杭州求是专利事务所有限公司
代理人 :
贾玉霞
优先权 :
CN202111477045.4
主分类号 :
G06V10/44
IPC分类号 :
G06V10/44  G06V10/82  G06K9/62  G06N3/04  G06N3/08  
相关图片
法律状态
2022-05-31 :
授权
2022-01-25 :
实质审查的生效
IPC(主分类) : G06V 10/44
申请日 : 20211206
2022-01-07 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN113902926A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332