一种基于信息熵过采样的软件缺陷预测方法及系统
实质审查的生效
摘要
本发明提供一种基于信息熵过采样的软件缺陷预测方法及系统,方法包括:获取软件缺陷数据集;将数据集划分为训练集测试集,并计算训练集中多数类样本和少数类样本的类确定性熵;根据类确定性熵将多数类样本和少数类样本划分为安全样本、关键样本、危险样本,并选择少数类关键样本作为种子样本;清除多数类危险样本;对少数类关键样本局部邻域约束过采样;采用新的平衡训练集训练软件缺陷预测模型,并对测试集进行测试。本发明解决了现有技术中存在的类不平衡及类重叠问题对分类模型产生不利影响,导致软件缺陷预测效果较差的技术问题。
基本信息
专利标题 :
一种基于信息熵过采样的软件缺陷预测方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114490386A
申请号 :
CN202210093923.0
公开(公告)日 :
2022-05-13
申请日 :
2022-01-26
授权号 :
暂无
授权日 :
暂无
发明人 :
严远亭苏振张以文张燕平
申请人 :
安徽大学
申请人地址 :
安徽省合肥市蜀山区肥西路3号
代理机构 :
合肥市浩智运专利代理事务所(普通合伙)
代理人 :
朱文振
优先权 :
CN202210093923.0
主分类号 :
G06F11/36
IPC分类号 :
G06F11/36 G06F16/215 G06K9/62
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F11/00
错误检测;错误校正;监控
G06F11/36
通过软件的测试或调试防止错误
法律状态
2022-05-31 :
实质审查的生效
IPC(主分类) : G06F 11/36
申请日 : 20220126
申请日 : 20220126
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载