PDF文档中表格的定位方法及装置
授权
摘要
本发明涉及一种PDF文档中表格的定位方法及装置,所述方法包括步骤:接收包含表格的PDF文档;从所述PDF文档的矢量流信息中提取字符信息和直线信息;根据所提取的字符信息和直线信息,定位所述PDF文档中的表格区域。本发明方法及装置是基于页面中所有的直线和文本块进行表格区域定位,相比于现有技术可以提高表格区域定位的准确性,继而为表格信息的准确解析提供基础。
基本信息
专利标题 :
PDF文档中表格的定位方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN108470021A
申请号 :
CN201810253203.X
公开(公告)日 :
2018-08-31
申请日 :
2018-03-26
授权号 :
CN108470021B
授权日 :
2022-06-03
发明人 :
余宙杨永智汪贤
申请人 :
阿博茨德(北京)科技有限公司
申请人地址 :
北京市海淀区学院路甲5号1幢1#厂房A座南2层A2-1-7
代理机构 :
北京市领专知识产权代理有限公司
代理人 :
林辉轮
优先权 :
CN201810253203.X
主分类号 :
G06F17/24
IPC分类号 :
G06F17/24
法律状态
2022-06-03 :
授权
2018-09-25 :
实质审查的生效
IPC(主分类) : G06F 17/24
申请日 : 20180326
申请日 : 20180326
2018-08-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载