一种大坝缺陷图像文本跨模态检索方法及模型
授权
摘要

本发明公开一种基于交叉注意力的大坝缺陷图像文本跨模态检索方法,包括:1)文本‑图像特征提取;2)文本‑图像交互特征提取,将图像特征图和文本特征向量输入到交叉注意力模块,提取每个图像特征图和整段文本的交互特征矩阵;3)文本‑图像特征图全局相似度计算,将交互特征矩阵使用余弦相似度计算得到相似矩阵,然后从文本检索和图像检索两个任务出发分别计算全局相似度,文本检索任务中,计算全局相似度时质量较高的图像特征图赋予更高的权重;4)最小化损失函数优化训练结果:采用改进的铰链三元排序函数作为损失函数,最小化排序函数来优化训练结果。本发明在大坝图像检索文本和大坝缺陷描述文本检索图像任务中取得了较好的检索效果。

基本信息
专利标题 :
一种大坝缺陷图像文本跨模态检索方法及模型
专利标题(英):
暂无
公开(公告)号 :
CN113220919A
申请号 :
CN202110535542.9
公开(公告)日 :
2021-08-06
申请日 :
2021-05-17
授权号 :
CN113220919B
授权日 :
2022-04-22
发明人 :
毛莺池陈静汪强黄倩李然王龙宝方晗陈豪卢俊钟鸣李玲付琨夏旭东陈智祥张洪伟罗松
申请人 :
河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司
申请人地址 :
江苏省南京市江宁开发区佛城西路8号
代理机构 :
南京乐羽知行专利代理事务所(普通合伙)
代理人 :
李玉平
优先权 :
CN202110535542.9
主分类号 :
G06F16/58
IPC分类号 :
G06F16/58  G06F16/38  G06K9/32  G06K9/62  G06F40/126  G06F40/242  G06F40/289  
相关图片
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/58
••使用元数据的特征检索,例如,不来自内容或者元数据派生的
法律状态
2022-04-22 :
授权
2021-08-24 :
实质审查的生效
IPC(主分类) : G06F 16/58
申请日 : 20210517
2021-08-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN113220919A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332