基于贝叶斯分类的中文垃圾邮件内容分类鉴别算法
发明专利申请公布后的视为撤回
摘要

目前,基于内容的垃圾邮件过滤问题是Internet安全技术研究的一个重点问题。将文本分类等机器学习的相关方法应用于垃圾邮件的搜索和判定是进行大量垃圾邮件处理的有效方法。贝叶斯分类方法在垃圾邮件处理上表现出了很高的准确度,并且表现出了可持续更新学习的优良特性,因此基于贝叶斯分类的垃圾邮件过滤方法受到了广泛的关注。当前贝叶斯分类算法中采用的特征选择方法有基于文档频数选择和基于互信息选择。这两种特征选择方法都不能有效地衡量低频词对分类的贡献。本发明提出了一个新的特征选择参量——似然比对数,它专门针对垃圾邮件分类应用,综合了低频词在邮件中出现和不出现的两种情况下对分类的影响,使得贝叶斯分类过程能够利用特征选择过程的计算结果,并通过实验证明了这种方法提高了分类结果的召回率和分类性能。

基本信息
专利标题 :
基于贝叶斯分类的中文垃圾邮件内容分类鉴别算法
专利标题(英):
暂无
公开(公告)号 :
CN1790405A
申请号 :
CN200510135603.3
公开(公告)日 :
2006-06-21
申请日 :
2005-12-31
授权号 :
暂无
授权日 :
暂无
发明人 :
钱德沛
申请人 :
钱德沛
申请人地址 :
100083北京市海淀区学院路35号世宁大厦16层中德所
代理机构 :
代理人 :
优先权 :
CN200510135603.3
主分类号 :
G06Q10/00
IPC分类号 :
G06Q10/00  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06Q
专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10/00
行政;管理
法律状态
2010-02-24 :
发明专利申请公布后的视为撤回
2009-04-08 :
专利申请权、专利权的转移(专利申请权的转移)
变更事项 : 申请人
变更前权利人 : 钱德沛
变更后权利人 : 北京航空航天大学
变更事项 : 地址
变更前权利人 : 北京市海淀区学院路35号世宁大厦16层中德所 邮政编码 : 100083
变更后权利人 : 北京市海淀区学院路37号北京航空航天大学7-58信箱 邮政编码 : 100191
登记生效日 : 20090306
2006-08-16 :
实质审查的生效
2006-06-21 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332