数据湖的知识图谱生成方法及装置
实质审查的生效
摘要
本发明公开了一种数据湖的知识图谱生成方法及装置,涉及大数据技术领域;其中该方法包括:获取数据湖中的多源异构数据,将所述多源异构数据作为主数据存储至对应结构的数据库中;主数据包括:结构化主数据、半结构化主数据、以及非结构化主数据;查询获取结构化主数据的数据表结构,根据所述数据表结构得到结构化主数据的元数据;根据半结构化主数据的格式对半结构化主数据进行解析,从解析结果中提取半结构化主数据的元数据;调用各非结构化主数据对应的算子提取非结构化主数据的元数据;利用知识图谱将各元数据进行融合关联,得到数据湖对应的知识图谱网络。本发明可以将数据湖中的数据进行有效关联,避免出现数据沼泽。
基本信息
专利标题 :
数据湖的知识图谱生成方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN114462603A
申请号 :
CN202210120630.7
公开(公告)日 :
2022-05-10
申请日 :
2022-02-09
授权号 :
暂无
授权日 :
暂无
发明人 :
李卓林
申请人 :
中国银行股份有限公司
申请人地址 :
北京市西城区复兴门内大街1号
代理机构 :
北京三友知识产权代理有限公司
代理人 :
杨丹
优先权 :
CN202210120630.7
主分类号 :
G06N5/02
IPC分类号 :
G06N5/02 G06K9/62
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06N
基于特定计算模型的计算机系统
G06N5/00
利用基于知识的模式的计算机系统
G06N5/02
知识表达
法律状态
2022-05-27 :
实质审查的生效
IPC(主分类) : G06N 5/02
申请日 : 20220209
申请日 : 20220209
2022-05-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载