结构化描述信息的提取方法、装置以及电子设备
实质审查的生效
摘要
本公开提供了结构化描述信息的提取方法、装置以及电子设备,涉及人工智能技术领域,尤其涉及自然语言处理、计算机视觉、深度学习技术领域。具体实现方案为:确定待处理的版式文件,其中,版式文件包括:多个内容片段;内容片段包括:多个字符片段;根据多个字符片段的坐标信息和属性信息,对多个字符片段进行分行处理,得到至少一个内容行;根据至少一个内容行中任意两个相邻内容行之间的语义关系和/或排版关系,对至少一个内容行进行分段落处理,得到至少一个内容段落,进而确定版式文件的结构化描述信息,从而能够结合语义关系和/或排版关系进行分段落处理,提高分段落处理的准确度,进而提高结构化描述信息提取的准确度。
基本信息
专利标题 :
结构化描述信息的提取方法、装置以及电子设备
专利标题(英):
暂无
公开(公告)号 :
CN114373187A
申请号 :
CN202111617878.6
公开(公告)日 :
2022-04-19
申请日 :
2021-12-20
授权号 :
暂无
授权日 :
暂无
发明人 :
缪萍徐明
申请人 :
北京百度网讯科技有限公司
申请人地址 :
北京市海淀区上地十街10号百度大厦二层
代理机构 :
北京清亦华知识产权代理事务所(普通合伙)
代理人 :
杜月
优先权 :
CN202111617878.6
主分类号 :
G06V30/416
IPC分类号 :
G06V30/416 G06V30/414 G06F40/30 G06N3/08
法律状态
2022-05-06 :
实质审查的生效
IPC(主分类) : G06V 30/416
申请日 : 20211220
申请日 : 20211220
2022-04-19 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载