多模态模型训练以及图像识别方法、装置、电子设备
授权
摘要

本发明揭示了一种多模态模型训练以及图像识别方法、装置、电子设备,涉及图像识别领域。该方法包括:获取样本图像以及样本图像对应的文字特征向量;将样本图像输入至初始多模态模型的特征提取网络,生成样本图像对应的图像特征向量。其中特征提取网络用于对样本图像进行编码,并根据待生成特征与已生成特征之间的关联关系生成图像特征向量;将文字特征向量以及图像特征向量输入至初始多模态模型的变换器结构中,输出样本图像对应的候选文字;根据文字特征向量对应的目标文字以及候选文字,更新初始多模态模型的参数,以确定目标多模态模型。采用该方法可以保证生成的图像特征向量的准确性,进而使得图像在生成的过程中局部感受野不会发生破坏。

基本信息
专利标题 :
多模态模型训练以及图像识别方法、装置、电子设备
专利标题(英):
暂无
公开(公告)号 :
CN114239760A
申请号 :
CN202210174577.9
公开(公告)日 :
2022-03-25
申请日 :
2022-02-25
授权号 :
CN114239760B
授权日 :
2022-05-20
发明人 :
申冲李峰
申请人 :
苏州浪潮智能科技有限公司
申请人地址 :
江苏省苏州市吴中经济开发区郭巷街道官浦路1号9幢
代理机构 :
北京三聚阳光知识产权代理有限公司
代理人 :
张琳琳
优先权 :
CN202210174577.9
主分类号 :
G06K9/62
IPC分类号 :
G06K9/62  G06V10/774  G06V10/80  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06K
数据识别;数据表示;记录载体;记录载体的处理
G06K9/00
用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置
G06K9/62
应用电子设备进行识别的方法或装置
法律状态
2022-05-20 :
授权
2022-04-12 :
实质审查的生效
IPC(主分类) : G06K 9/62
申请日 : 20220225
2022-03-25 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332