一种从多源数据中提取指标方法、系统、设备及存储介质
实质审查的生效
摘要

本发明提出了一种从多源数据中提取指标方法、系统、设备及存储介质,通过获取包括相关业务数据、相关部门数据的多源数据,对于多源数据进行包括删除空值内容、分词、去停用词的预处理,以行业专家给出的关键词列表作为索引,扩充关键词关联范围,将某个关键词关联范围内的词语均视为该关键词主题的关联词;构建LDA主题模型,利用LDA主题模型对所述多源数据建模分析并得出新兴主题;利用指数函数公式对新兴主题进行指数建构,以处理后输出的聚类词为结果,辅以筛选归类,最终生成分类指标。本发明充分利用已有的、大量相关的数据信息,同时能避免传统指数构建过程中过于依赖专家领域知识的限制,从而实现独立高效地从大量数据中提取重要指标。

基本信息
专利标题 :
一种从多源数据中提取指标方法、系统、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114492431A
申请号 :
CN202210070333.6
公开(公告)日 :
2022-05-13
申请日 :
2022-01-21
授权号 :
暂无
授权日 :
暂无
发明人 :
杜登斌杜乐杜小军
申请人 :
武汉东湖大数据交易中心股份有限公司
申请人地址 :
湖北省武汉市东湖新技术开发区高新大道999号龙山创新园一期F3栋2101室
代理机构 :
武汉红观专利代理事务所(普通合伙)
代理人 :
徐春燕
优先权 :
CN202210070333.6
主分类号 :
G06F40/289
IPC分类号 :
G06F40/289  G06F40/216  G06F16/35  G06F16/31  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/289
短语分析,例如有限状态技术或分块
法律状态
2022-05-31 :
实质审查的生效
IPC(主分类) : G06F 40/289
申请日 : 20220121
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332