一种基于多粒度特征的多标签场景图生成方法
实质审查的生效
摘要
本发明公开了一种基于多粒度特征的多标签场景图生成方法。该方法包括如下步骤:获取用于训练场景图生成的数据集;对数据集中的所有关系类别进行粗细粒度分类和统计,得到每个关系类别的所有共生关系并构建每个关系类别的共生标签。使用预训练的目标检测器,检测出数据集图像中所有物体;使用多粒度模块建立每张图像的多粒度特征,并对图像中的每个物体对构建多分类标签;利用多粒度特征作为输入,数据集标签、多分类标签、共生标签作为监督,训练关系检测器;最后从目标图像中得到物体和关系的预测结果,使用多标签场景图生成器转化成场景图。本发明充分利用关系类别间的联系,并用多粒度视觉特征对物体进行建模,能够更好地适应场景图生成任务。
基本信息
专利标题 :
一种基于多粒度特征的多标签场景图生成方法
专利标题(英):
暂无
公开(公告)号 :
CN114359568A
申请号 :
CN202210049814.9
公开(公告)日 :
2022-04-15
申请日 :
2022-01-17
授权号 :
暂无
授权日 :
暂无
发明人 :
励雪巍缪佩翰李玺
申请人 :
浙江大学
申请人地址 :
浙江省杭州市西湖区余杭塘路866号
代理机构 :
杭州求是专利事务所有限公司
代理人 :
傅朝栋
优先权 :
CN202210049814.9
主分类号 :
G06V10/40
IPC分类号 :
G06V10/40 G06V10/764 G06V10/774 G06V10/82 G06K9/62 G06N3/04 G06N3/08
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06V 10/40
申请日 : 20220117
申请日 : 20220117
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载