嵌套HTML实体解码方法、装置、计算机设备和存储介质
授权
摘要
本发明涉及文本处理技术领域,提供了一种嵌套HTML方法、装置、计算机设备和存储介质,所述方法包括:获取HTML文本,得到待解码字符串;将所述待解码字符串输入确定有限状态转译器;按照所述待解码字符串中各字符的顺序以及对应前一个字符的状态位置,分别匹配各字符所满足的转移条件,根据所述转移条件对应的转换方式将各所述字符在所述确定有限状态转译器中进行状态转移;当状态转移到所述确定有限状态转译器的最终状态集时,输出状态转移后的待解码字符串,得到解码字符串。采用本方法能够提高嵌套HTML实体解码的处理效率。
基本信息
专利标题 :
嵌套HTML实体解码方法、装置、计算机设备和存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114090928A
申请号 :
CN202210076706.0
公开(公告)日 :
2022-02-25
申请日 :
2022-01-24
授权号 :
CN114090928B
授权日 :
2022-04-08
发明人 :
段炼周忠诚黄九鸣张圣栋
申请人 :
湖南四方天箭信息科技有限公司
申请人地址 :
湖南省长沙市高新开发区岳麓西大道588号芯城科技园8栋1301房
代理机构 :
代理人 :
优先权 :
CN202210076706.0
主分类号 :
G06F16/957
IPC分类号 :
G06F16/957 G06F40/126
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/957
•••浏览优化,例如通过缓存
法律状态
2022-04-08 :
授权
2022-03-15 :
实质审查的生效
IPC(主分类) : G06F 16/957
申请日 : 20220124
申请日 : 20220124
2022-02-25 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载