一种基于多层级编码-解码器的视频描述方法及系统
授权
摘要
本发明公开了一种基于多层级编码‑解码器的视频描述方法及系统,该方法包括:获取视频并基于多层级编码器进行编码处理,构建目标图和事件图;基于多层级解码器对目标图和事件图进行解码,得到句子序列和单词序列,基于多任务学习完成文本描述任务和句子标签预测任务。该系统包括:编码模块和解码模块。本发明基于多层级编码器和多层级解码器,能够挖掘语句中细粒度的关系并提升描述性能。本发明作为一种基于多层级编码‑解码器的视频描述方法及系统,可广泛应用于视频处理领域。
基本信息
专利标题 :
一种基于多层级编码-解码器的视频描述方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN112738647A
申请号 :
CN202011581321.7
公开(公告)日 :
2021-04-30
申请日 :
2020-12-28
授权号 :
CN112738647B
授权日 :
2022-04-01
发明人 :
郑慧诚余明静王腾刘泽华
申请人 :
中山大学
申请人地址 :
广东省广州市海珠区新港西路135号
代理机构 :
深圳市创富知识产权代理有限公司
代理人 :
高冰
优先权 :
CN202011581321.7
主分类号 :
H04N21/84
IPC分类号 :
H04N21/84 H04N19/42 H04N21/44 H04N21/234 G06N3/04
法律状态
2022-04-01 :
授权
2021-05-21 :
实质审查的生效
IPC(主分类) : H04N 21/84
申请日 : 20201228
申请日 : 20201228
2021-04-30 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN112738647A.PDF
PDF下载