仿人工细粒度网页信息采集方法
专利权的终止
摘要

本发明针对当前网页信息采集所采用的字典式和格式区分式采集方法存在的所能细分化采集到的数据量十分有限、效率低、准确率低、建设成本高、适用面窄等问题,公开了一种能模拟人工工作的采集方法的仿人工细粒度网页信息采集方法,它可广泛用于建立细粒度查询的搜索引擎、商业情报收集、电子商务网站信息量的低成本丰富等等,与传统网络机器人采集出的粗粒度全文信息相比,本发明大大提高了细分采集信息价值,所采集到的细分信息可以直接用于商务情报的分析、各类数据库系统的数据源,甚至可以直接用做同类网站的数据库。

基本信息
专利标题 :
仿人工细粒度网页信息采集方法
专利标题(英):
暂无
公开(公告)号 :
CN1845098A
申请号 :
CN200610038392.6
公开(公告)日 :
2006-10-11
申请日 :
2006-02-20
授权号 :
暂无
授权日 :
暂无
发明人 :
于磊潘郁
申请人 :
南京工业大学
申请人地址 :
210009江苏省南京市中山北路200号
代理机构 :
南京天华专利代理有限责任公司
代理人 :
夏平
优先权 :
CN200610038392.6
主分类号 :
G06F17/30
IPC分类号 :
G06F17/30  
相关图片
法律状态
2010-09-01 :
专利权的终止
未缴年费专利权终止号牌文件类型代码 : 1605
号牌文件序号 : 101005278607
IPC(主分类) : G06F 17/30
专利号 : ZL2006100383926
申请日 : 20060220
授权公告日 : 20071212
2007-12-12 :
授权
2006-12-06 :
实质审查的生效
2006-10-11 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN100354865C.PDF
PDF下载
2、
CN1845098A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332