一种针对扫描文档的信息提取和结构化方法
公开
摘要
本发明公开了一种针对扫描文档的信息提取和结构化方法,用于实现基于图像识别算法的非结构化文档处理和图片区域信息的文本结构化处理,其特征在于,包括图像监测;图像分类;图像预处理;文本检测;文本识别;版式识别;表格线检测;表格线生成;结构化处理;结构化输出。本发明通过将人工智能的图像识别技术与业务需求深度融合,利用图像识别中的OCR技术及文本结构处理技术,实现了申请材料自动化识别和校验,构建了全流程无人化服务运营模式,减轻工作人员的人工机械化工作,实现泛在的、全天候的无人化服务。
基本信息
专利标题 :
一种针对扫描文档的信息提取和结构化方法
专利标题(英):
暂无
公开(公告)号 :
CN114299528A
申请号 :
CN202111610235.9
公开(公告)日 :
2022-04-08
申请日 :
2021-12-27
授权号 :
暂无
授权日 :
暂无
发明人 :
林涵孔子详周靖靖张健孔令闯童庆周栋
申请人 :
万达信息股份有限公司
申请人地址 :
上海市徐汇区桂平路481号20号楼5层
代理机构 :
上海申汇专利代理有限公司
代理人 :
翁若莹
优先权 :
CN202111610235.9
主分类号 :
G06V30/413
IPC分类号 :
G06V30/413 G06V10/764 G06V10/82 G06V30/414
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载