数据处理方法、装置、设备及存储介质
实质审查的生效
摘要
本公开提供一种数据处理方法、装置、设备及存储介质,涉及计算机技术领域。该方法包括:获取待处理可携带文档格式PDF文件的待处理图像格式页,待处理图像格式页通过将待处理PDF文件中的待处理页格式转换为图像获得;利用图表检测模型对待处理图像格式页进行图表检测,获得待处理图像格式页的目标图表区域的信息;利用图表分类模型对目标图表区域进行分类,获得目标图表区域的图表类别标签,图表类别标签包括数据图类、非数据图类和表格类;根据目标图表区域的图表类别标签,获得待处理PDF文件的待处理图像格式页的目标图表区域的相关内容。该方法提高了提取PDF文件中的图表信息的准确性。
基本信息
专利标题 :
数据处理方法、装置、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114359924A
申请号 :
CN202111462781.2
公开(公告)日 :
2022-04-15
申请日 :
2021-11-30
授权号 :
暂无
授权日 :
暂无
发明人 :
许鑫邵溪濛何立汉任桂军
申请人 :
泰康保险集团股份有限公司;泰康资产管理有限责任公司
申请人地址 :
北京市西城区复兴门内大街156号
代理机构 :
隆天知识产权代理有限公司
代理人 :
石海霞
优先权 :
CN202111462781.2
主分类号 :
G06V30/40
IPC分类号 :
G06V30/40 G06V30/413 G06V30/414 G06V30/146 G06K9/62 G06N3/04 G06N3/08 G06V30/10
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06V 30/40
申请日 : 20211130
申请日 : 20211130
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载