半结构化数据规范处理方法、存储介质及设备
实质审查的生效
摘要
本发明公开一种半结构化数据规范处理方法,包括:S1、根据业务实体,配置实体模型;S2、分析获取到的文本文件,识别出含有半结构化数据的内容;S3、通过解释数据转化为计算机能识别的XML数据;S4、对所述XML数据进行数据缺失值处理;S5、根据所述实体模型对S4处理后的数据进行标准化对标处理;S6、根据所述实体模型,对S5处理后的数据进行对标填值,形成标准格式化的数据结构;S7、将处理好的数据根据实体模型存入结构化数据库供使用。本发明通过分析半结构化数据中的模式和实体,自动抽取出半结构化数据中的实体及它们间的上下位关系,自动构建实体分类树,从而可以大大减少计算量,降低计算复杂度。
基本信息
专利标题 :
半结构化数据规范处理方法、存储介质及设备
专利标题(英):
暂无
公开(公告)号 :
CN114329076A
申请号 :
CN202111523092.8
公开(公告)日 :
2022-04-12
申请日 :
2021-12-13
授权号 :
暂无
授权日 :
暂无
发明人 :
龚波苏学武水军赵坚杰陈海发陈育平李剑金林家泳
申请人 :
珠海市新德汇信息技术有限公司
申请人地址 :
广东省珠海市高新区唐家湾镇科技三路19号1栋
代理机构 :
广东朗乾律师事务所
代理人 :
闫有幸
优先权 :
CN202111523092.8
主分类号 :
G06F16/81
IPC分类号 :
G06F16/81
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/81
••索引,例如 XML标签; 其数据结构; 存储结构
法律状态
2022-04-29 :
实质审查的生效
IPC(主分类) : G06F 16/81
申请日 : 20211213
申请日 : 20211213
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载