基于语义指导的视频行为检测方法
实质审查的生效
摘要
本发明公开了基于语义指导的视频行为检测方法,通过特征的下采样来扩大时间感受野,并将线性插值用于上采样环节,从而得到视频时序上的粗略语义信息,用于指导时间卷积模型的输出;同时对模型的主干网络使用参数共享结构,将网络分为了三部分:生成粗略预测、细化和最终预测,以实现网络层数与参数量的最佳搭配;针对模型的时间建模能力,本发明提供了一种不需人工标注的视频速度预测的自监督辅助任务,可通过随机采样率的变换来模拟视频的播放速度,以辅助主干网络生成质量更高的预测。本发明主要针对以人为主体的视频,具有参数量低、精度高,方便对长视频进行操作等特点;对于无人的视频,本发明根据转场对视频进行分割。
基本信息
专利标题 :
基于语义指导的视频行为检测方法
专利标题(英):
暂无
公开(公告)号 :
CN114332723A
申请号 :
CN202111669113.7
公开(公告)日 :
2022-04-12
申请日 :
2021-12-31
授权号 :
暂无
授权日 :
暂无
发明人 :
任柯燕张云路张淳闫桐赵虎
申请人 :
北京工业大学
申请人地址 :
北京市朝阳区平乐园100号
代理机构 :
北京思海天达知识产权代理有限公司
代理人 :
沈波
优先权 :
CN202111669113.7
主分类号 :
G06V20/40
IPC分类号 :
G06V20/40 G06N3/04 G06N3/08
法律状态
2022-04-29 :
实质审查的生效
IPC(主分类) : G06V 20/40
申请日 : 20211231
申请日 : 20211231
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载