一种征信报告识别方法
实质审查的生效
摘要
本发明涉及一种征信报告识别方法,该方法包括获取等待识别的征信报告的图像数据;对图像数据进行预处理;对预处理完成的图像数据进行全文识别,获取文本行内容以及框线信息;针对图像数据中版式结构进行分析,判断图像数据中单双页;将文本行内容与模板信息进行信息类型匹配;针对匹配完成的文本行内容根据信息类型进行提取;针对提取结果进行校验和汇总;将检验汇总后的提取结果依据特定格式输出至xml文件中;该方法可高效地从图像中抽取相关信息,并针对匹配到的字段类型进行结构化提取和字段校验,并运用组结构方式将所有信息进行分类整合出来,最终还原整份征信报告内容分布,其识别准确率高,识别结果完整,且支持多样场景识别,适应性强。
基本信息
专利标题 :
一种征信报告识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114529932A
申请号 :
CN202210145731.X
公开(公告)日 :
2022-05-24
申请日 :
2022-02-17
授权号 :
暂无
授权日 :
暂无
发明人 :
何倩倩饶顶锋陶坚坚刘伟
申请人 :
北京译图智讯科技有限公司
申请人地址 :
北京市昌平区回龙观镇黄平路19号院2号5层520
代理机构 :
北京精金石知识产权代理有限公司
代理人 :
杨兰兰
优先权 :
CN202210145731.X
主分类号 :
G06V30/416
IPC分类号 :
G06V30/416 G06V30/42 G06V30/148 G06V30/19 G06V10/82
法律状态
2022-06-10 :
实质审查的生效
IPC(主分类) : G06V 30/416
申请日 : 20220217
申请日 : 20220217
2022-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载