一种全线表表格结构识别方法
实质审查的生效
摘要

本发明公开了一种全线表表格结构识别方法,包括:采用实例分割算法对文档图像进行单元格分割,得到每一个单元格对应于文档图像中单元格所在区域的二值化掩码图像;将每一个单元格的二值化掩码图像进行或运算和形态学闭操作,得到表格整体区域图像及表格整体区域图像的二值化掩码图像;采用矫正算法,在获得表格整体区域图像中表格区域的四个顶点后,利用TPS变换以这四个顶点为基准将弯曲表格修正为以这四个顶点为顶点的近似四边形表格区域,并使用透视变换将近似四边形表格区域转换成水平矩形的正表格图像;进行单元格目标检测获得每一个单元格的边界框;利用基于规则化排序算法进行排序以识别表格结构,将表格结构表达成对应的标记语言描述。

基本信息
专利标题 :
一种全线表表格结构识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114529925A
申请号 :
CN202210425844.5
公开(公告)日 :
2022-05-24
申请日 :
2022-04-22
授权号 :
暂无
授权日 :
暂无
发明人 :
黄双萍彭政华杨帆
申请人 :
华南理工大学;人工智能与数字经济广东省实验室(广州)
申请人地址 :
广东省广州市天河区五山路381号
代理机构 :
东莞卓诚专利代理事务所(普通合伙)
代理人 :
朱鹏
优先权 :
CN202210425844.5
主分类号 :
G06V30/412
IPC分类号 :
G06V30/412  G06V10/24  G06V10/26  G06V10/28  G06V10/44  G06V10/764  G06K9/62  
法律状态
2022-06-10 :
实质审查的生效
IPC(主分类) : G06V 30/412
申请日 : 20220422
2022-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332