OCR识别模型训练方法、OCR识别方法及相关装置
公开
摘要

本申请提供了OCR识别模型训练方法、OCR识别方法及相关装置,OCR识别模型训练方法包括:将无标注数据的第一图像样本切分为多个第一图像块,随机选取部分第一图像块进行遮挡,得到遮挡图像块和未遮挡图像块;利用遮挡图像块和未遮挡图像块,以重构第一图像样本的预设特征为目标,对预先构建包含编码器和第一解码器的初始特征识别模型进行预训练;基于预训练特征识别模型中的编码器和第二解码器构建任务处理模型;将有标注数据的第二图像样本切分为多个第二图像块;采用多个第二图像块和第二图像样本包含的词片序列对任务处理模型进行训练,得到OCR识别模型。本申请无需大量标注数据,模型训练效率高,同时,训练方法使得OCR识别模型的识别能力高。

基本信息
专利标题 :
OCR识别模型训练方法、OCR识别方法及相关装置
专利标题(英):
暂无
公开(公告)号 :
CN114565751A
申请号 :
CN202210192272.0
公开(公告)日 :
2022-05-31
申请日 :
2022-02-28
授权号 :
暂无
授权日 :
暂无
发明人 :
曹智
申请人 :
慧择(成都)网络科技有限公司
申请人地址 :
四川省成都市高新区锦云东三巷1号B3
代理机构 :
深圳市深佳知识产权代理事务所(普通合伙)
代理人 :
戴皓
优先权 :
CN202210192272.0
主分类号 :
G06V10/22
IPC分类号 :
G06V10/22  G06V10/774  G06V10/82  G06K9/62  G06N3/04  G06N3/08  
法律状态
2022-05-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332