一种数据表格扫描图像的结构化转换方法
实质审查的生效
摘要
本发明涉及一种数据表格扫描图像的结构化转换方法,包括以下步骤:1)获取数据表格的扫描图像;2)提取扫描图像中的文字位置信息和表格位置信息;3)根据文字位置信息和表格位置信息,获取文本在表格中的行列位置信息;4)根据行列位置信息,逐一识别每一个表格中单元格内的文本识别信息;5)重构包含文本识别信息和表格位置信息的电子表格文档;6)将电子表格文档转化成字典形式的结构化数据。与现有技术相比,本发明准确性高,实现自动结构化转换,效率高。
基本信息
专利标题 :
一种数据表格扫描图像的结构化转换方法
专利标题(英):
暂无
公开(公告)号 :
CN114357045A
申请号 :
CN202111651270.5
公开(公告)日 :
2022-04-15
申请日 :
2021-12-30
授权号 :
暂无
授权日 :
暂无
发明人 :
毛玮韵魏本刚徐湘忆陈璐吴天逸彭政睿任辰
申请人 :
国网上海市电力公司
申请人地址 :
上海市浦东新区自由贸易试验区源深路1122号
代理机构 :
上海科盛知识产权代理有限公司
代理人 :
杨元焱
优先权 :
CN202111651270.5
主分类号 :
G06F16/25
IPC分类号 :
G06F16/25 G06F16/24
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/25
••涉及数据库管理系统的集合或接口系统
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06F 16/25
申请日 : 20211230
申请日 : 20211230
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载