一种文字识别方法及系统
授权
摘要
本发明提供一种文字识别方法及系统,该方法包括:获取待识别的自然场景文字图像;将自然场景文字图像输入到文字识别模型中,得到文字内容;其中,文字识别模型是由视觉识别网络、视觉信息优化网络和语义信息优化网络构成的;视觉信息优化网络和语义信息优化网络,用于根据文字识别网络输出的字符特征,分别生成对应的文字识别补充信息,以供文字识别网络基于文字识别补充信息,对文字识别结果进行优化。本发明通过使用视觉信息优化网络和语义信息优化网络,在视觉特征和语言结果两个层面,获取全局信息,并将得到视觉和语义的线索,作为视觉识别网络迭代执行识别过程的补充信息,从而逐步获取更为鲁棒的识别结果,提高文字识别精度。
基本信息
专利标题 :
一种文字识别方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114092930A
申请号 :
CN202210012962.3
公开(公告)日 :
2022-02-25
申请日 :
2022-01-07
授权号 :
CN114092930B
授权日 :
2022-05-03
发明人 :
王金桥陈盈盈谭颖韬
申请人 :
中科视语(北京)科技有限公司
申请人地址 :
北京市门头沟区石龙经济开发区永安路20号3号楼A-6193室
代理机构 :
北京路浩知识产权代理有限公司
代理人 :
吴刚
优先权 :
CN202210012962.3
主分类号 :
G06V20/62
IPC分类号 :
G06V20/62 G06V30/14 G06V30/18 G06V30/19 G06K9/62 G06N3/04 G06N3/08
法律状态
2022-05-03 :
授权
2022-03-15 :
实质审查的生效
IPC(主分类) : G06V 20/62
申请日 : 20220107
申请日 : 20220107
2022-02-25 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载