基于语义指导的视频行为检测方法

实质审查的生效

摘要

本发明公开了基于语义指导的视频行为检测方法，通过特征的下采样来扩大时间感受野，并将线性插值用于上采样环节，从而得到视频时序上的粗略语义信息，用于指导时间卷积模型的输出；同时对模型的主干网络使用参数共享结构，将网络分为了三部分：生成粗略预测、细化和最终预测，以实现网络层数与参数量的最佳搭配；针对模型的时间建模能力，本发明提供了一种不需人工标注的视频速度预测的自监督辅助任务，可通过随机采样率的变换来模拟视频的播放速度，以辅助主干网络生成质量更高的预测。本发明主要针对以人为主体的视频，具有参数量低、精度高，方便对长视频进行操作等特点；对于无人的视频，本发明根据转场对视频进行分割。

基本信息

专利标题：

基于语义指导的视频行为检测方法

专利标题（英）：

暂无

公开（公告）号：

CN114332723A

申请号：

CN202111669113.7

公开（公告）日：

2022-04-12

申请日：

2021-12-31

授权号：

暂无

授权日：

暂无

发明人：

任柯燕张云路张淳闫桐赵虎

申请人：

北京工业大学

申请人地址：

北京市朝阳区平乐园100号

代理机构：

北京思海天达知识产权代理有限公司

代理人：

沈波

优先权：

CN202111669113.7

主分类号：

G06V20/40

IPC分类号：

G06V20/40 G06N3/04 G06N3/08

法律状态

2022-04-29 ：

实质审查的生效

IPC(主分类) : G06V 20/40
申请日 : 20211231

2022-04-12 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载