一种表格识别方法及系统
公开
摘要
本发明涉及数字图像处理技术领域,其目的在于提供一种表格识别方法及系统。其中的表格识别方法包括:获取文档图像,并从文档图像中,提取出仅包含表格的图像区域,得到表格图像;对表格图像进行预处理,得到预处理后表格图像;对预处理后表格图像中的表格线进行信号增强,得到增强后表格图像;提取增强后表格图像中表格内各交点的点集,并根据点集得到增强后表格图像的表格结构;对增强后表格图像进行文本检测,得到文本检测结果;对文本检测结果进行文字识别,得到文字识别结果;根据表格结构及文字识别结果,生成电子表格。本发明可针对版面复杂的保单等文档中的表格进行检测、识别和还原,便于对复杂文档进行表格自动录入和归档管理。
基本信息
专利标题 :
一种表格识别方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114581928A
申请号 :
CN202111632890.4
公开(公告)日 :
2022-06-03
申请日 :
2021-12-29
授权号 :
暂无
授权日 :
暂无
发明人 :
陈君麟林子越
申请人 :
壹链盟生态科技有限公司
申请人地址 :
广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)
代理机构 :
成都顶峰专利事务所(普通合伙)
代理人 :
陈秋霞
优先权 :
CN202111632890.4
主分类号 :
G06V30/412
IPC分类号 :
G06V30/412 G06V30/148 G06T7/11 G06T5/40 G06T5/30 G06K9/62 G06F40/183 G06F40/18 G06V10/774
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载