基于LSTM和社交网络的层次化文本分类方法
实质审查的生效
摘要

本发明公开一种基于LSTM和社交网络的层次化文本分类方法,步骤包括:步骤1,从社交网站上采集文本数据,对原数据集中质量较低且无意义的文本进行检测和过滤后对数据进行人工标记;步骤2,对步骤1得到的带标签的数据集进行平衡化处理;步骤3,对步骤2平衡化后的数据集进行分词及产生词向量;步骤4,将步骤3得到的词向量集进行投入LSTM网络中进行监督学习,得到初步分类结果;步骤5,将初步分类结果中正确结果的部分投入至社交网络模型作进一步分类,得到的分类结果与初步分类结果相结合即为最终分类结果。本发明针对不常见的极度不平衡,耦合,丰富暗语,社交性质的数据有较好的分类效果。

基本信息
专利标题 :
基于LSTM和社交网络的层次化文本分类方法
专利标题(英):
暂无
公开(公告)号 :
CN114443809A
申请号 :
CN202111565473.2
公开(公告)日 :
2022-05-06
申请日 :
2021-12-20
授权号 :
暂无
授权日 :
暂无
发明人 :
魏嵬李晓婉张贝贝
申请人 :
西安理工大学
申请人地址 :
陕西省西安市碑林区金花南路5号
代理机构 :
西安弘理专利事务所
代理人 :
王奇
优先权 :
CN202111565473.2
主分类号 :
G06F16/33
IPC分类号 :
G06F16/33  G06F16/35  G06F16/9536  G06F40/284  G06F40/289  G06N3/04  G06N3/08  G06Q50/00  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/33
••查询
法律状态
2022-05-24 :
实质审查的生效
IPC(主分类) : G06F 16/33
申请日 : 20211220
2022-05-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332