一种PDF文档到XML文档转换的方法
专利权的终止
摘要

本发明公开了一种PDF文档到XML文档转换的方法,(一)中间文档生成模块(7):针对PDF样本文档(2)的内容,根据语义项和文本块之间的映射关系,系统自动生成标记语义项和信息块特征的中间XML文档(3);(二)规则生成模块:对PDF样本文档(2)进行分析和处理,调用中间文档生成模块(7)产生的中间XML文档(3),通过文档解析器读取PDF源文档(1)的内容,并将其转换为规则的XSLT文档;(三)自动抽取模块:接受规则的XSLT文档,得到满足目标DTD文档并具有语义信息的目标XML文档(5)。本发明可以对转换后的XML文档做进一步的操作,从而提高文档自动分类和用户信息检索的效率。

基本信息
专利标题 :
一种PDF文档到XML文档转换的方法
专利标题(英):
暂无
公开(公告)号 :
CN1776673A
申请号 :
CN200510122890.4
公开(公告)日 :
2006-05-24
申请日 :
2005-12-03
授权号 :
暂无
授权日 :
暂无
发明人 :
张文德宋艳娟陈振标杨传耀陈俊林朱丹红
申请人 :
福州大学
申请人地址 :
350002福建省福州市工业路523号
代理机构 :
代理人 :
优先权 :
CN200510122890.4
主分类号 :
G06F17/30
IPC分类号 :
G06F17/30  
法律状态
2012-02-15 :
专利权的终止
未缴年费专利权终止号牌文件类型代码 : 1605
号牌文件序号 : 101182510030
IPC(主分类) : G06F 17/30
专利号 : ZL2005101228904
申请日 : 20051203
授权公告日 : 20071107
终止日期 : 20101203
2007-11-07 :
授权
2006-07-19 :
实质审查的生效
2006-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332