一种基于关联可信度计算的数据筛选方法、系统和存储介质
公开
摘要
本发明公开了一种基于关联可信度计算的数据筛选方法,包括以下步骤:收集数据资源,生成原始数据汇总表;清洗原始数据汇总表,生成汇总数据表;设计汇总数据表中关联字段可信度的评估指标,计算关联字段在每个指标下的可信度得分;采用变异系数法,计算所述评估指标的指标系数;结合所述可信度得分和所述指标系数,计算关联字段的可信度;对关联字段的可信度进行抽样,与真实数据交叉验证,优化后生成可信度最高的落地数据表。在大数据处理体系中,本方案通过综合各类数据、进行特征选择,建立可信度评分模型,对获取的原始数据进行关联可信度打分,为数据分析、应用提供数据可信程度的支撑和参考,提升数据分析、应用的效果。
基本信息
专利标题 :
一种基于关联可信度计算的数据筛选方法、系统和存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114297199A
申请号 :
CN202111636366.4
公开(公告)日 :
2022-04-08
申请日 :
2021-12-29
授权号 :
暂无
授权日 :
暂无
发明人 :
卢居辉吴文鄢小征谢信喜张凤王龙
申请人 :
厦门市美亚柏科信息股份有限公司
申请人地址 :
福建省厦门市思明区软件园二期观日路12号102-402单元
代理机构 :
厦门福贝知识产权代理事务所(普通合伙)
代理人 :
郭涵炜
优先权 :
CN202111636366.4
主分类号 :
G06F16/22
IPC分类号 :
G06F16/22 G06F16/215
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/22
••索引;数据结构;存储结构
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载