基于智能语料库的图像文字识别方法、系统及设备
公开
摘要

本发明属于图像文字识别领域,具体涉及了一种基于智能语料库的图像文字识别方法、系统及设备,旨在解决现有技术忽略图像文字之外的源语言、场景、语义关联等信息,导致存在字迹模糊、遮挡等的待识别图像的文字识别准确性低的问题。本发明包括:进行多种源语言对照语料信息的语义提取及对齐,构建多源语言语料库;训练获取多种源语言对应的图像文字识别模型;进行存在文字模糊和文字遮挡的待识别图像的OCR文字识别;提取待识别图像的源语言种类,结合OCR文字识别结果,获取待识别图像的推荐识别结果和各识别结果的置信度;以高于设定阈值的推荐识别结果和对应的置信度为识别结果。本发明可结合场景进行多种源语言的图像文字识别,准确性高。

基本信息
专利标题 :
基于智能语料库的图像文字识别方法、系统及设备
专利标题(英):
暂无
公开(公告)号 :
CN114612912A
申请号 :
CN202210225509.0
公开(公告)日 :
2022-06-10
申请日 :
2022-03-09
授权号 :
暂无
授权日 :
暂无
发明人 :
张婷曲笑辰王方
申请人 :
中译语通科技股份有限公司
申请人地址 :
北京市石景山区石景山路20号中铁建设大厦
代理机构 :
北京绘聚高科知识产权代理事务所(普通合伙)
代理人 :
罗硕
优先权 :
CN202210225509.0
主分类号 :
G06V30/40
IPC分类号 :
G06V30/40  G06V30/10  G06F40/279  G06N3/04  G06N3/08  
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332