一种基于分工决策的视觉问答模型的视觉问答方法及系统
实质审查的生效
摘要

本发明属于图像问答领域,具体涉及一种基于分工决策的视觉问答模型的视觉问答方法及系统,该方法包括:获取视觉图像和待回答的问题,将视觉图像和待回答的问题输入到LRBNet模型中,得到问答结果;LRBNet模型包括视觉理解模块、文本理解模块以及交换模块;所述视觉理解模块用于得到视觉特征图,所述文本理解模块用于得到文本特征图,所述交换模块用于对视觉特征图和文本特征图进行数据交互,根据交互数据更新节点;视觉空间特征图和文本语义信息进行关联和更新,得到最终的问答结果;本发明将文本语义信息和视觉空间信息分离处理,只在最后将处理的结果融合,降低了其他VQA模型因跨模态融合而提高的推理难度。

基本信息
专利标题 :
一种基于分工决策的视觉问答模型的视觉问答方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114283292A
申请号 :
CN202111483361.2
公开(公告)日 :
2022-04-05
申请日 :
2021-12-07
授权号 :
暂无
授权日 :
暂无
发明人 :
丰江帆刘睿国龙仁华易成杰
申请人 :
重庆邮电大学
申请人地址 :
重庆市南岸区南山街道崇文路2号
代理机构 :
重庆辉腾律师事务所
代理人 :
卢胜斌
优先权 :
CN202111483361.2
主分类号 :
G06V10/44
IPC分类号 :
G06V10/44  G06V10/74  G06V10/80  G06V10/774  G06K9/62  G06V30/148  G06F40/30  
法律状态
2022-04-22 :
实质审查的生效
IPC(主分类) : G06V 10/44
申请日 : 20211207
2022-04-05 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332