一种基于智能流量导向切换的数据反爬取方法及装置
授权
摘要
本发明公开了一种基于智能流量导向切换的数据反爬取方法及装置,方法包括:获取网站核心数据,根据算法生成与核心数据类似的虚假数据,将虚假数据存储至预先构建的虚假数据服务器对应的数据库中;检测到访问请求,根据访问请求的请求信息识别出爬虫程序;将爬虫程序对应的请求导入到虚假数据服务器,返回虚假数据服务器对应的数据库中的虚假数据。本发明实施例相比传统的反爬手段,不是将爬虫程序扼杀在访问请求中,而将所有的爬虫请求引导到需要的服务端,返回错误的数据,增大爬虫的成本的同时也不会影响网站本身的请求压力。
基本信息
专利标题 :
一种基于智能流量导向切换的数据反爬取方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN110474890A
申请号 :
CN201910688075.6
公开(公告)日 :
2019-11-19
申请日 :
2019-07-29
授权号 :
CN110474890B
授权日 :
2022-05-10
发明人 :
黄兴鲁
申请人 :
深圳数位传媒科技有限公司
申请人地址 :
广东省深圳市南山区粤海街道科苑路15号科兴科学园B栋1单元18层
代理机构 :
广东良马律师事务所
代理人 :
李良
优先权 :
CN201910688075.6
主分类号 :
H04L29/06
IPC分类号 :
H04L29/06 G06F21/62 G06F16/958
相关图片
法律状态
2022-05-10 :
授权
2022-04-29 :
著录事项变更
IPC(主分类) : H04L 9/40
变更事项 : 申请人
变更前 : 深圳数位传媒科技有限公司
变更后 : 深圳数位大数据科技有限公司
变更事项 : 地址
变更前 : 518000 广东省深圳市南山区粤海街道科苑路15号科兴科学园B栋1单元18层
变更后 : 518000 广东省深圳市南山区粤海街道高新区社区高新南环路42号北邮科技大厦1001
变更事项 : 申请人
变更前 : 深圳数位传媒科技有限公司
变更后 : 深圳数位大数据科技有限公司
变更事项 : 地址
变更前 : 518000 广东省深圳市南山区粤海街道科苑路15号科兴科学园B栋1单元18层
变更后 : 518000 广东省深圳市南山区粤海街道高新区社区高新南环路42号北邮科技大厦1001
2019-12-13 :
实质审查的生效
IPC(主分类) : H04L 29/06
申请日 : 20190729
申请日 : 20190729
2019-11-19 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN110474890A.PDF
PDF下载