一种基于版式文件处理大文件的方法
授权
摘要

本发明涉及计算机技术领域,具体涉及一种基于版式文件处理大文件的方法。该方法包括:获取大文件的每页子文件中的可视化图像,获取每个语义元素的位置索引;对可视化图像中的文本数据进行分词并获取每个词的重要程度;同时获取可视化图像的分割图像;对于分割图像的每个语义元素,获取前景区域中的图像数据与背景区域的第一差异、文本数据与背景区域的第二差异,根据每个词对应的第二差异以及重要程度获取语义元素中的文本优先级,根据第一差异和文本优先级获取每个语义元素的显著度;按照显著度的大小将每页子文件的所有语义元素依次传输至客户端,以使客户端对其进行元素组装。本发明实施例能够使大文件传输流畅的同时首先显示重要部分。

基本信息
专利标题 :
一种基于版式文件处理大文件的方法
专利标题(英):
暂无
公开(公告)号 :
CN114359313A
申请号 :
CN202210266996.5
公开(公告)日 :
2022-04-15
申请日 :
2022-03-18
授权号 :
CN114359313B
授权日 :
2022-05-27
发明人 :
陆猛孙高健赵云庄玉龙朱静宇张伟谢文迅孙肖辉郭尚杨瑞钦
申请人 :
北京点聚信息技术有限公司
申请人地址 :
北京市海淀区西三旗昌临813号7号楼1层1001
代理机构 :
郑州知倍通知识产权代理事务所(普通合伙)
代理人 :
夏开松
优先权 :
CN202210266996.5
主分类号 :
G06T7/11
IPC分类号 :
G06T7/11  G06T7/194  G06T7/90  H04L1/00  G06F40/30  G06F40/289  G06F40/216  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06T
一般的图像数据处理或产生
G06T5/00
图像的增强或复原
G06T5/50
通过使用多于一幅图像的,例如平均、减少
G06T7/11
区域分割
法律状态
2022-05-27 :
授权
2022-05-03 :
实质审查的生效
IPC(主分类) : G06T 7/11
申请日 : 20220318
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332