端到端文本图像翻译模型训练方法
公开
摘要

本公开提供一种端到端文本图像翻译模型训练方法,包括:对包含源端语言文本的图像及源端语言文本进行预处理,获取预处理后的子图像及文本字符串;对包含源端语言文本的子图像通过图像编码器编码,获取图像特征,对预处理后的文本字符串通过文本编码器编码,获取文本特征;通过序列特征编码器分别对图像特征和所述文本特征进行编码,获取图像序列特征和文本序列特征;基于图像序列特征、文本序列特征,计算不同的损失值;基于不同的损失值,构建损失函数;以及基于损失函数,在通过训练模型进行训练时,更新所述训练模型的参数。本公开还提供一种端到端文本图像翻译模型训练装置、电子设备以及可读存储介质。

基本信息
专利标题 :
端到端文本图像翻译模型训练方法
专利标题(英):
暂无
公开(公告)号 :
CN114626392A
申请号 :
CN202210193873.3
公开(公告)日 :
2022-06-14
申请日 :
2022-03-01
授权号 :
暂无
授权日 :
暂无
发明人 :
周玉马聪
申请人 :
北京中科凡语科技有限公司
申请人地址 :
北京市海淀区知春路63号51号楼10层1006
代理机构 :
北京庚致知识产权代理事务所(特殊普通合伙)
代理人 :
韩德凯
优先权 :
CN202210193873.3
主分类号 :
G06F40/58
IPC分类号 :
G06F40/58  G06F40/284  G06F40/126  G06V10/26  G06V10/20  G06N20/00  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/58
使用机器翻译,例如用于多语言检索,用于客户端设备的服务器端翻译或实时翻译。
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332