一种基于深度图神经网络的新闻收集及自动化提取方法
公开
摘要

本发明涉及深度学习技术领域,公开了一种基于深度图神经网络的新闻收集及自动化提取方法,步骤:S1.收集用于训练的新闻站点;S2.以HTML标签为单位,标注收集到的新闻站点中的新闻链接,并通过深度图神经网络进行训练,得到链接提取模型;S3.以HTML标签为单位,标注收集到的新闻链接中的新闻内容,并构建新闻内容提取模型;S4.标注收集到的新闻内容中的正文内容,构建正文分类模型;S5.收集需要分析的新闻站点的主页HTML源码,将主页HTML源码输入到链接提取模型中,并得到新闻链接;将新闻链接输入新闻内容提取模型,得到新闻内容;最后将新闻内容输入正文分类模型,提取到新闻信息。本发明解决了现有技术计算复杂,不能方便快捷地提取新闻中的重要信息的问题。

基本信息
专利标题 :
一种基于深度图神经网络的新闻收集及自动化提取方法
专利标题(英):
暂无
公开(公告)号 :
CN114564638A
申请号 :
CN202210109381.1
公开(公告)日 :
2022-05-31
申请日 :
2022-01-28
授权号 :
暂无
授权日 :
暂无
发明人 :
何宇轩牟昊李旭日徐亚波
申请人 :
广东横琴数说故事信息科技有限公司
申请人地址 :
广东省珠海市横琴新区宝华路6号105室-72989(集中办公区)
代理机构 :
广州粤高专利商标代理有限公司
代理人 :
禹小明
优先权 :
CN202210109381.1
主分类号 :
G06F16/9535
IPC分类号 :
G06F16/9535  G06F16/9538  G06K9/62  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/9535
••••基于用户配置文件和个性化自定义搜索
法律状态
2022-05-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332