一种基于N-gram与频繁模式挖掘的系统日志解析方法
授权
摘要
本发明提出了一种基于N‑gram与频繁模式挖掘的系统日志解析方法。本发明将多行日志消息依次根据空格分解为单个的单词;计算任意两行日志消息之间的N‑gram距离;本发明通过算出N分别取值1,2,3时,任意两行日志消息之间的1‑gram距离、2‑gram距离和3‑gram距离,计算任意两行日志消息的相似匹配值,当匹配值高于设定阈值的日志消息归为一类;设置频繁模式挖掘算法的频繁单词项集的长度以及频繁模式挖掘算法的频繁单词项集的支持度;对每一类别中的所有日志消息使用频繁模式挖掘算法,挖掘出每一类中符合参数设定的候选频繁单词项集,并生成该类的日志模板。本发明在保证分类准确性的前提下,减少计算机处理的时间,节约了计算资源,提高了分类效率。
基本信息
专利标题 :
一种基于N-gram与频繁模式挖掘的系统日志解析方法
专利标题(英):
暂无
公开(公告)号 :
CN112882997A
申请号 :
CN202110195563.0
公开(公告)日 :
2021-06-01
申请日 :
2021-02-19
授权号 :
CN112882997B
授权日 :
2022-06-07
发明人 :
应时胡胜康王冰明
申请人 :
武汉大学
申请人地址 :
湖北省武汉市武昌区珞珈山武汉大学
代理机构 :
武汉科皓知识产权代理事务所(特殊普通合伙)
代理人 :
许莲英
优先权 :
CN202110195563.0
主分类号 :
G06F16/17
IPC分类号 :
G06F16/17 G06F40/284 G06F16/2458 G06K9/62
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/17
••文件系统功能的进一步细节
法律状态
2022-06-07 :
授权
2021-06-18 :
实质审查的生效
IPC(主分类) : G06F 16/17
申请日 : 20210219
申请日 : 20210219
2021-06-01 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载