一种基于注意力机制的全局交互的图像语义解析方法
实质审查的生效
摘要
本发明构建了一种基于注意力机制的全局交互的图像语义解析方法,并应用于图像语义标题的生成,具体步骤为:1)选择目标图像特征提取模型,对图像数据进行特征提取与编码;2)搭建全局交互的双向循环神经网络对图像特征进行解析;3)将提取的图像特征信息进行标准正则化处理,并以全局信息的方式实时送入语义解析模型,进行模型训练;4)在语义解析过程中加入注意力机制,使模型在语义解析过程中重点关注不同图像区域的信息;5)通过训练好的模型对新的目标图像进行语义解析。本发明建立的图像语义理解模型和算法生成的图像语义具有逻辑性强、语义丰富的特点,模型收敛速度快,语义解析精度高,对复杂图像或者注重细节的图像语义解析精确度高等优点。
基本信息
专利标题 :
一种基于注意力机制的全局交互的图像语义解析方法
专利标题(英):
暂无
公开(公告)号 :
CN114549887A
申请号 :
CN202011251599.8
公开(公告)日 :
2022-05-27
申请日 :
2020-11-11
授权号 :
暂无
授权日 :
暂无
发明人 :
库涛熊艳彬杨琦瑞南琳刘金鑫林乐新王海张志东马岩
申请人 :
中国科学院沈阳自动化研究所
申请人地址 :
辽宁省沈阳市沈河区南塔街114号
代理机构 :
沈阳科苑专利商标代理有限公司
代理人 :
王倩
优先权 :
CN202011251599.8
主分类号 :
G06V10/764
IPC分类号 :
G06V10/764 G06V10/82 G06K9/62 G06N3/04
法律状态
2022-06-14 :
实质审查的生效
IPC(主分类) : G06V 10/764
申请日 : 20201111
申请日 : 20201111
2022-05-27 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载