自动识别文件编码的方法及计算机可读存储介质
授权
摘要

本发明公开了一种自动识别文件编码识别方法及计算机可读存储介质,方法包括:采集样本文件;分别将样本文件的文件编码转换为预设的各编码,生成各编码对应的正向字词库;分别将样本文件通过与其文件编码不同的其他编码进行解码,得到乱码文件并记录编码转化方向;根据乱码文件,生成其编码转化方向对应的反向字词库;获取待识别文件;依次通过一编码对待识别文件进行解码;获取解码后的待识别文件中的词语和单字,并分别将词语和单字在对应的正向字词库以及反向字词库中进行匹配,得到正向匹配数和反向匹配数;若正向匹配数大于反向匹配数,则将一编码作为待识别文件的文件编码。本发明可正确识别出文件编码。

基本信息
专利标题 :
自动识别文件编码的方法及计算机可读存储介质
专利标题(英):
暂无
公开(公告)号 :
CN113064863A
申请号 :
CN202110207832.0
公开(公告)日 :
2021-07-02
申请日 :
2019-04-19
授权号 :
CN113064863B
授权日 :
2022-06-07
发明人 :
刘德建陈丛亮郭玉湖
申请人 :
福建天晴数码有限公司
申请人地址 :
福建省福州市开发区君竹路83号科技发展中心大楼第四层Q476室(自贸试验区内)
代理机构 :
福州市博深专利事务所(普通合伙)
代理人 :
颜丽蓉
优先权 :
CN202110207832.0
主分类号 :
G06F16/16
IPC分类号 :
G06F16/16  H03M7/30  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/16
••文件或文件夹操作,例如,具体使用与文件系统的用户接口的细节
法律状态
2022-06-07 :
授权
2021-07-20 :
实质审查的生效
IPC(主分类) : G06F 16/16
申请日 : 20190419
2021-07-02 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332