结构化文本的提取方法、装置、存储介质及计算机设备
公开
摘要

本申请实施例公开了一种结构化文本的提取方法、装置、存储介质及计算机设备,涉及信息提取领域。本申请和现有技术中的OCR算法提取文本信息相比,OCR算法提取到的是非结构化文本,后续还需要利用正则表达式将非结构文本转换为结构化文本,而本申请预先设置目标字段,根据字段检测模型确定位置和字段识别模型直接生成结构化文本,可提高文本识别的速度和准确性,对文本发生重叠、模糊和遮挡的情况下,也能具有较高的抗干扰能力。

基本信息
专利标题 :
结构化文本的提取方法、装置、存储介质及计算机设备
专利标题(英):
暂无
公开(公告)号 :
CN114627479A
申请号 :
CN202210138720.9
公开(公告)日 :
2022-06-14
申请日 :
2022-02-15
授权号 :
暂无
授权日 :
暂无
发明人 :
薛闯陈志衔朱莹莹张建冬陈家荣
申请人 :
远光软件股份有限公司
申请人地址 :
广东省珠海市科技创新海岸远光软件园
代理机构 :
广东朗乾律师事务所
代理人 :
杨焕军
优先权 :
CN202210138720.9
主分类号 :
G06V30/40
IPC分类号 :
G06V30/40  G06V30/146  G06V30/19  G06K9/62  
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332