一种扩展短文本词特征向量的分类改进方法
授权
摘要

本发明涉及一种扩展短文本词特征向量的分类改进方法,该方法引入了Word2vec语言模型对短文本进行词嵌入扩展短文本特征向量以解决短文本稀疏性,并将词向量转换成概率语义分布来测量语义关联性;针对短文本扩展后的特征向量,利用改进后的特征权重算法并引入语义相关度去处理扩展后的词特征向量。本方法可以区分出扩展后的短文本中的词的重要程度,以获得更准确的语义相关度,可以有效地提高短文本的分类效果。实验证明,本文的方法能够保证短文本挖掘特征向量准确性的同时,更大大的提高了短文本分类的精确性,效果显著。可用于热点话题分类挖掘、监测舆情信息等各种领域决策方向中,具有较强的实用价值。

基本信息
专利标题 :
一种扩展短文本词特征向量的分类改进方法
专利标题(英):
暂无
公开(公告)号 :
CN108763348A
申请号 :
CN201810460923.3
公开(公告)日 :
2018-11-06
申请日 :
2018-05-15
授权号 :
CN108763348B
授权日 :
2022-05-03
发明人 :
王诚孟涛
申请人 :
南京邮电大学
申请人地址 :
江苏省南京市鼓楼区新模范马路66号
代理机构 :
南京苏科专利代理有限责任公司
代理人 :
牛莉莉
优先权 :
CN201810460923.3
主分类号 :
G06F17/30
IPC分类号 :
G06F17/30  
法律状态
2022-05-03 :
授权
2018-11-30 :
实质审查的生效
IPC(主分类) : G06F 17/30
申请日 : 20180515
2018-11-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332