一种基于时空超分辨率的视频描述方法及电子设备
实质审查的生效
摘要

本发明涉及一种基于时空超分辨率的视频描述方法及电子设备,所述方法基于一视频描述模型实现,包括以下步骤:获取输入视频,对该输入视频进行采样获得包含若干压缩尺寸帧的视频帧序列;通过所述视频描述模型,对所述视频帧序列进行多模态特征提取和特征编码,动态融合编码后的多模态特征,逐步解码生成视频描述语句;其中,所述视频描述模型训练时,从空间和时间两个维度上重构原始分辨率的帧和相邻采样帧之间的中间缺失帧,以重构误差和解码预测误差构建损失函数,实现模型训练。与现有技术相比,本发明具有描述丰富准确、泛化能力强、计算开销低等优点。

基本信息
专利标题 :
一种基于时空超分辨率的视频描述方法及电子设备
专利标题(英):
暂无
公开(公告)号 :
CN114549317A
申请号 :
CN202210167971.X
公开(公告)日 :
2022-05-27
申请日 :
2022-02-23
授权号 :
暂无
授权日 :
暂无
发明人 :
王瀚漓曹铨辉
申请人 :
同济大学
申请人地址 :
上海市杨浦区四平路1239号
代理机构 :
上海科盛知识产权代理有限公司
代理人 :
翁惠瑜
优先权 :
CN202210167971.X
主分类号 :
G06T3/40
IPC分类号 :
G06T3/40  G06T9/00  G06F40/30  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06T
一般的图像数据处理或产生
G06T3/00
在图像平面内的图形图像转换
G06T3/40
整个或部分图像的缩放
法律状态
2022-06-14 :
实质审查的生效
IPC(主分类) : G06T 3/40
申请日 : 20220223
2022-05-27 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332