一种基于描述文本的视频问答方法
实质审查的生效
摘要

本发明公开了一种基于描述文本的视频问答方法,属于自然语言处理和计算机视觉领域。本发明将视频的视觉信息通过文本来进行描述,在特征提取时考虑了常识特征的获取,在生成视频描述时对问题单词进行了短语级划分并基于短语使用了多重注意力,此外,还利用了知识库对视频描述内容做进一步的扩充,使得生成的视频描述包含视频的绝大部分视觉信息,之后,将视频描述和问题进行语义上的交互和分析,得到新的融合特征,最后将该特征输入到分类器中进行分类得到预测的答案,同时利用了知识库对答案的语义进行判断。本发明避免了跨模态信息融合的分析的困难,并使用了知识库对描述信息进行补充,从而提升了视频问答的准确率。

基本信息
专利标题 :
一种基于描述文本的视频问答方法
专利标题(英):
暂无
公开(公告)号 :
CN114387537A
申请号 :
CN202111439356.1
公开(公告)日 :
2022-04-22
申请日 :
2021-11-30
授权号 :
暂无
授权日 :
暂无
发明人 :
胡锦祥孟朝晖
申请人 :
河海大学
申请人地址 :
江苏省南京市江宁区佛城西路8号
代理机构 :
南京经纬专利商标代理有限公司
代理人 :
周科技
优先权 :
CN202111439356.1
主分类号 :
G06V20/40
IPC分类号 :
G06V20/40  G06V10/74  G06V10/764  G06V10/774  G06K9/62  G06V10/82  G06F16/2457  G06F40/284  G06N3/04  G06N3/08  
法律状态
2022-05-10 :
实质审查的生效
IPC(主分类) : G06V 20/40
申请日 : 20211130
2022-04-22 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332