一种视觉定位方法、装置、设备及介质
实质审查的生效
摘要

本申请公开了一种视觉定位方法、装置、设备及介质,涉及人工智能技术领域,该方法包括:对图像编码特征与文本编码特征进行特征拼接;对拼接后编码特征进行特征融合,得到第一融合后编码特征;基于预设跨注意力机制分别对第一融合后编码特征与文本编码特征进行噪声修正,得到修正后融合特征与修正后文本编码特征,对拼接后编码特征与修正后文本编码特征进行特征融合得到第二融合后编码特征;利用基于修正后融合特征和第二融合后编码特征确定的目标编码特征对预设框特征进行修正,以预测目标视觉物体的区域位置坐标,可见,本申请基于预设跨注意力机制对图文噪声进行修正,通过降低对文本中噪声部分的关注度削弱了噪声的影响,实现抗噪视觉定位。

基本信息
专利标题 :
一种视觉定位方法、装置、设备及介质
专利标题(英):
暂无
公开(公告)号 :
CN114511472A
申请号 :
CN202210407177.8
公开(公告)日 :
2022-05-17
申请日 :
2022-04-19
授权号 :
暂无
授权日 :
暂无
发明人 :
李晓川李仁刚赵雅倩郭振华范宝余
申请人 :
苏州浪潮智能科技有限公司
申请人地址 :
江苏省苏州市吴中经济开发区郭巷街道官浦路1号9幢
代理机构 :
北京集佳知识产权代理有限公司
代理人 :
柳虹
优先权 :
CN202210407177.8
主分类号 :
G06T5/00
IPC分类号 :
G06T5/00  G06T9/00  G06T7/70  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06T
一般的图像数据处理或产生
G06T5/00
图像的增强或复原
法律状态
2022-06-03 :
实质审查的生效
IPC(主分类) : G06T 5/00
申请日 : 20220419
2022-05-17 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332