一种表格信息提取方法及系统
实质审查的生效
摘要
本发明属于图像处理和模式识别技术领域,公开了一种表格信息提取方法及系统,所述方法包括:获取表格图像;检测文本行位置,获取文本块坐标信息;识别文本行内容,获取文本块文字内容和方向信息;校正图像方向,根据文本块位置角度、方向信息计算出图像倾斜角度并进行倾斜校正;表格线分析预测,将图像输入到深度学习模型中,提取表格线特征图;分析融合表格线生成二值图;分析表格单元格信息,基于四边界线理论聚类并计算表格行列信息;融合单元格信息;格式化输出。本发明能对表格图像进行精准提取和复原,充分利用深度神经网络优秀的特征提取能力和传统图像处理算法高性能的优势,提升了方案的鲁棒性和通用性,表格提取速度和效果优良。
基本信息
专利标题 :
一种表格信息提取方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114419647A
申请号 :
CN202111665466.X
公开(公告)日 :
2022-04-29
申请日 :
2021-12-31
授权号 :
暂无
授权日 :
暂无
发明人 :
饶顶锋陶坚坚刘伟
申请人 :
北京译图智讯科技有限公司
申请人地址 :
北京市昌平区回龙观镇黄平路19号院2号5层520
代理机构 :
北京精金石知识产权代理有限公司
代理人 :
杨兰兰
优先权 :
CN202111665466.X
主分类号 :
G06V30/414
IPC分类号 :
G06V30/414 G06K9/62 G06N3/04 G06N3/08 G06V10/44 G06V10/774 G06V10/80 G06V10/82
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : G06V 30/414
申请日 : 20211231
申请日 : 20211231
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载