基于改进深度特征加权的朴素贝叶斯文本分类方法
授权
摘要
本发明公开了一种基于改进深度特征加权的朴素贝叶斯文本分类方法,包括:获取文本的特征词,根据不同的特征词出现的类别数和文本数,得到相应的特征类别概率和特征文本概率,进而得到特征的二维信息增益;利用所述二维信息增益与深度加权方式相结合对特征加权朴素贝叶斯模型进行深度加权,得到改进深度特征加权的朴素贝叶斯模型;对于任意文本,利用改进深度特征加权的朴素贝叶斯模型分别计算属于各特征类别的概率,选出最大的概率值对应的类别即文本所属类别。本发明能够使传统朴素贝叶斯算法的特征独立性假设得到抑制,为文本分类任务提供准确和快速的分类方法。
基本信息
专利标题 :
基于改进深度特征加权的朴素贝叶斯文本分类方法
专利标题(英):
暂无
公开(公告)号 :
CN108647259A
申请号 :
CN201810382423.2
公开(公告)日 :
2018-10-12
申请日 :
2018-04-26
授权号 :
CN108647259B
授权日 :
2022-06-10
发明人 :
张昀于舒娟何伟朱文峰金海红董茜茜
申请人 :
南京邮电大学;南京邮电大学南通研究院有限公司
申请人地址 :
江苏省南京市栖霞区文苑路9号
代理机构 :
南京纵横知识产权代理有限公司
代理人 :
董建林
优先权 :
CN201810382423.2
主分类号 :
G06F17/30
IPC分类号 :
G06F17/30 G06K9/62
法律状态
2022-06-10 :
授权
2018-11-06 :
实质审查的生效
IPC(主分类) : G06F 17/30
申请日 : 20180426
申请日 : 20180426
2018-10-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载