一种基于类别感知特征聚合的视频目标检测方法

公开

摘要

本发明公开了一种基于类别感知特征聚合的视频目标检测方法，包括：检测主干ResNet‑101对视频帧进行特征提取，获得高层语义信息；利用可形变卷积进行亚像素级的特征对齐，随后使用区域生成网络RPN为每一帧生成目标候选框；使用候选框分类模块对生成的候选框进行分类操作，后续仅对具有相同类标签的候选框进行特征聚合；在进行类别感知特征聚合时，使用广范围逐层递进特征聚合模块进行双向且逐层递进的候选框层级的特征聚合操作；使用类间关系建模模块对同一帧上的不同类别目标进行空间位置上的关系建模；将聚合后的候选框特征输入到全连接层以进行具体类别判别和目标框位置的回归修正。本发明使得时序信息和空间位置信息都得到充分利用，从而有效提高视频目标的检测性能。

基本信息

专利标题：

一种基于类别感知特征聚合的视频目标检测方法

专利标题（英）：

暂无

公开（公告）号：

CN114612820A

申请号：

CN202210199529.5

公开（公告）日：

2022-06-10

申请日：

2022-03-01

授权号：

暂无

授权日：

暂无

发明人：

郑慧诚陈蔓薇樊迪威

申请人：

中山大学

申请人地址：

广东省广州市海珠区新港西路135号

代理机构：

深圳市创富知识产权代理有限公司

代理人：

高冰

优先权：

CN202210199529.5

主分类号：

G06V20/40

IPC分类号：

G06V20/40 G06V10/74 G06V10/774 G06K9/62

法律状态

2022-06-10 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载