一种基于不平衡动态流数据分类的垃圾邮件过滤方法、设备及存...
公开
摘要

本发明涉及一种基于不平衡动态流数据分类的垃圾邮件过滤方法、设备及存储介质。本发明首先,基于时间戳等大小划分数据块。然后,将保留的先前时刻的小样本过采样候选数据块中的小类集。并使用马氏距离评估先前小样本与当前小类集的相似度。如果基于相似度评估的过采样技术无法平衡候选数据块的类别分布,则进一步利用候选数据块中边界小样本进行SMOTE生成新的小样本。最后,使用类别分布平衡的扩充候选邮件数据块训练得到基础分类器。为了降低垃圾邮件过滤模型的时空开销以及提高模型对概念漂移适应的速度,使用集成剪枝技术去除集成框架中性能最差的若干基础分类器。对垃圾邮件的过滤即使用集成模型中每个基础分类器的预测结果。

基本信息
专利标题 :
一种基于不平衡动态流数据分类的垃圾邮件过滤方法、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114629871A
申请号 :
CN202210196592.3
公开(公告)日 :
2022-06-14
申请日 :
2022-02-28
授权号 :
暂无
授权日 :
暂无
发明人 :
张延楠张珂杰谭锦志尚璇胡麦芳
申请人 :
杭州趣链科技有限公司
申请人地址 :
浙江省杭州市滨江区丹枫路399号2号楼A楼2001室
代理机构 :
杭州奥创知识产权代理有限公司
代理人 :
王佳健
优先权 :
CN202210196592.3
主分类号 :
H04L51/212
IPC分类号 :
H04L51/212  H04L51/42  G06K9/62  
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332