基于网络爬虫技术的电力营商环境信息采集系统
实质审查的生效
摘要

本发明公开了一种基于网络爬虫技术的电力营商环境信息采集系统,包括信息采集模块、网页处理及下载模块、数据储存和展示模块,信息采集模块是整个爬虫系统实现的基础,输入关键词,它就会在模拟浏览器向万维网发送HTTP请求,检索包含这些关键字的信息,信息采集模块获得的只包含所需要采集网页的标题和链接,为了查看数据,需要对网页进行处理和下载,将下载下来的HTML文件装换为PDF文件,文件转换使用Adobe Acrobat DC软件完成。本发明可以根据电力从业者的使用要求来制定不同的爬取要求,根据使用者输入的关键字,向互联网发送请求,找到相关的信息的URL,然后在对这些URL进行处理,实现以高效便捷的方式爬取需要的相关数据,以便显著提高爬虫的速度,具有很好的推广应用价值。

基本信息
专利标题 :
基于网络爬虫技术的电力营商环境信息采集系统
专利标题(英):
暂无
公开(公告)号 :
CN114443926A
申请号 :
CN202111612380.0
公开(公告)日 :
2022-05-06
申请日 :
2021-12-27
授权号 :
暂无
授权日 :
暂无
发明人 :
燕跃豪宋建辉鲍薇孙晨光李连卷原征韩丽陈起
申请人 :
国网河南省电力公司郑州供电公司;河南煜晖能源科技有限公司;郑州大学;国家电网有限公司
申请人地址 :
河南省郑州市淮河西路19号
代理机构 :
郑州金成知识产权事务所(普通合伙)
代理人 :
郭乃凤
优先权 :
CN202111612380.0
主分类号 :
G06F16/951
IPC分类号 :
G06F16/951  G06F16/955  G06F16/958  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/951
•••索引; 网络抓取技术
法律状态
2022-05-24 :
实质审查的生效
IPC(主分类) : G06F 16/951
申请日 : 20211227
2022-05-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332