一种基于PDF文档的表格信息提取方法、装置及设备
公开
摘要

本发明提供了一种基于PDF文档的表格信息提取方法、装置及设备,对电子化生成的海运提单PDF文档进行表格结构的提取,并对表格结构进行表格线补全,通过完整的表格结构,进行基于连通域检测的文本内容空间划分,并对目标连通域进行“键值‑内容”对的匹配、整合、提取,从而提高了海运提单中表格信息提取的准确度。通过对海运提单内容的自动化解析和提取,有利于提高海运提单信息的核对效率,以构建智慧海运信息平台,从而节省海运服务公司的人力消耗和物力消耗。

基本信息
专利标题 :
一种基于PDF文档的表格信息提取方法、装置及设备
专利标题(英):
暂无
公开(公告)号 :
CN114581930A
申请号 :
CN202210159376.1
公开(公告)日 :
2022-06-03
申请日 :
2022-02-21
授权号 :
暂无
授权日 :
暂无
发明人 :
匡国文王旭李婷婷柳崎峰
申请人 :
深圳职业技术学院
申请人地址 :
广东省深圳市南山区西丽街道西丽湖镇西丽湖畔
代理机构 :
广州三环专利商标代理有限公司
代理人 :
麦小婵
优先权 :
CN202210159376.1
主分类号 :
G06V30/413
IPC分类号 :
G06V30/413  G06V30/418  G06V30/148  
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332