一种基于时空注意力模型的视频摘要生成方法
授权
摘要

本发明公开了一种基于时空注意力模型的视频摘要生成方法,该方法基于“随手拍”视频的两个特点:“空间显著物体的吸引力”和“时间语义信息相关”,提出将时间语义信息和空间视觉信息融合,并以联合概率的形式以确定是关键帧的概率。首先将视频文件分解成帧序列,按照帧的时间顺序依次使用深度神经网络分别提取显著域特征和语义特征;显著域特征用于确定图像画面中,能够引起观众注意的区域;语义特征用于匹配当前视频帧与前后连续多张视频帧信息的关联程度,确定时序上的关键信息;通过对空间和时间上视频帧重要性的评估,确定时空上均有重要信息的关键帧;将重要性得分高的关键帧组成视频摘要。

基本信息
专利标题 :
一种基于时空注意力模型的视频摘要生成方法
专利标题(英):
暂无
公开(公告)号 :
CN112418012A
申请号 :
CN202011238229.0
公开(公告)日 :
2021-02-26
申请日 :
2020-11-09
授权号 :
CN112418012B
授权日 :
2022-06-07
发明人 :
胡瑞敏胡敏王晓晨
申请人 :
武汉大学
申请人地址 :
湖北省武汉市武昌区珞珈山武汉大学
代理机构 :
武汉科皓知识产权代理事务所(特殊普通合伙)
代理人 :
王琪
优先权 :
CN202011238229.0
主分类号 :
G06K9/00
IPC分类号 :
G06K9/00  G06K9/46  G06K9/62  G06N3/04  G06F16/74  
相关图片
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06K
数据识别;数据表示;记录载体;记录载体的处理
G06K9/00
用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置
法律状态
2022-06-07 :
授权
2021-03-16 :
实质审查的生效
IPC(主分类) : G06K 9/00
申请日 : 20201109
2021-02-26 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN112418012A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332