一种基于级联Transformer的视频群体行为识别方法
授权
摘要

本发明涉及计算机视觉及深度学习领域,尤其涉及一种基于级联Transformer的视频群体行为识别方法,首先采集生成视频数据集,将视频数据集经过三维骨干网络提取三维时空特征,选取关键帧图像空间特征图;对关键帧图像空间特征图进行预处理后送入人体目标检测Transformer,输出关键帧图像中的人体目标框;然后,映射筛选后人体目标框在关键帧图像特征图上所对应的子特征图,结合关键帧图像周围帧特征图计算query/key/value,输入群体行为识别Transfomer,输出群体级别时空编码特征图;最后,经过多层感知机对群体行为进行分类。本发明具有有效提高群体行为识别准确率的效果。

基本信息
专利标题 :
一种基于级联Transformer的视频群体行为识别方法
专利标题(英):
暂无
公开(公告)号 :
CN113673489A
申请号 :
CN202111225547.8
公开(公告)日 :
2021-11-19
申请日 :
2021-10-21
授权号 :
CN113673489B
授权日 :
2022-04-08
发明人 :
李玲徐晓刚王军祝敏航曹卫强朱亚光
申请人 :
之江实验室
申请人地址 :
浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼
代理机构 :
杭州浙科专利事务所(普通合伙)
代理人 :
孙孟辉
优先权 :
CN202111225547.8
主分类号 :
G06K9/00
IPC分类号 :
G06K9/00  G06K9/62  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06K
数据识别;数据表示;记录载体;记录载体的处理
G06K9/00
用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置
法律状态
2022-04-08 :
授权
2021-12-07 :
实质审查的生效
IPC(主分类) : G06K 9/00
申请日 : 20211021
2021-11-19 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332