一种网页分类方法、终端设备及存储介质
授权
摘要
本发明涉及一种网页分类方法、终端设备及存储介质,该方法中包括:S1:采集多种类型的网页,根据每个网页中至少两种类型的特征构建图结构,并对网页的类型进行标记后,将所有具有类型标记的图结构组成训练集;S2:构建图卷积神经网络模型,通过训练集对图卷积神经网络模型进行训练,将训练后的模型作为网页分类模型;S3:针对待分类网页,根据步骤S1所述的至少两种类型的特征构建图结构后,通过网页分类模型确定图结构对应的网页类型。本发明充分学习网页中的文本和图片等额外的异构信息来构建网页分类模型,相对现有网页分类方法,能有效的解决基于单一数据结构的网页分类方法的局限性,能够明显解决网页特征稀疏问题。
基本信息
专利标题 :
一种网页分类方法、终端设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN112131506A
申请号 :
CN202011013718.6
公开(公告)日 :
2020-12-25
申请日 :
2020-09-24
授权号 :
CN112131506B
授权日 :
2022-04-29
发明人 :
陈志明赵建强庄灿波刘晓芳曾鹏
申请人 :
厦门市美亚柏科信息股份有限公司
申请人地址 :
福建省厦门市软件园二期观日路12号102-402单元
代理机构 :
厦门市精诚新创知识产权代理有限公司
代理人 :
何家富
优先权 :
CN202011013718.6
主分类号 :
G06F16/958
IPC分类号 :
G06F16/958 G06K9/62 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/958
•••网络站点的组织或管理,例如:发布,自动链接或保持页面
法律状态
2022-04-29 :
授权
2021-01-12 :
实质审查的生效
IPC(主分类) : G06F 16/958
申请日 : 20200924
申请日 : 20200924
2020-12-25 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载