一种图片表格线提取模型构建方法及图片表格提取方法
公开
摘要
本发明涉及图形提取领域。本发明提供一种图片表格线提取模型构建方法,首先,选择训练数据;对包含表格的图像进行分析,使用预设宽度的线段标注每一条表格线,并对在线段上的像素点进行标记;未标记的部分则视为背景部分;其次,利用训练数据构建数据集;针对任意一个数据集,将其随机拆分为训练集及测试集;然后,构建U‑Net模型、U‑Net++模型或U‑Net与U‑Net++的集成模型,采用训练集对模型进行训练;直至经测试集测试,模型预测性能达到预设值后停止训练,图片表格线提取模型构建完成。从而实现降低训练集构造难度,结合U‑Net和U‑Net++模型的优势,更加准确的进行图形表格提取。
基本信息
专利标题 :
一种图片表格线提取模型构建方法及图片表格提取方法
专利标题(英):
暂无
公开(公告)号 :
CN114581932A
申请号 :
CN202210105293.4
公开(公告)日 :
2022-06-03
申请日 :
2022-01-28
授权号 :
暂无
授权日 :
暂无
发明人 :
孙丰茂闫腾许永安罗来丰
申请人 :
中国电建集团山东电力建设有限公司
申请人地址 :
山东省济南市汉峪金融商务中心三区5号楼
代理机构 :
成都希盛知识产权代理有限公司
代理人 :
陈泽斌
优先权 :
CN202210105293.4
主分类号 :
G06V30/414
IPC分类号 :
G06V30/414 G06V30/412 G06K9/62 G06V10/774
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载