一种基于相似数据检测的云存储冗余数据预测方法和设备
公开
摘要

本发明提供了一种基于相似数据检测的云存储冗余数据预测方法和设备,其中方法包括:对云存储数据进行分块,得到数据块;遍历所有数据块,利用哈希算法计算出数据块对应的哈希指纹;利用N‑transform方法计算数据块的相似特征组;根据待预测的数据集的大小,选定m个数据块;遍历提取的所有数据块组成的数据块集合,利用伯努利二项分布循环选取m个初始样本;遍历初始样本组成的初始样本集,基于哈希指纹和相似特征组进行判断,将其中不符合哈希指纹和相似特征组条件的重复数据块添加到基样本中,得到基样本集;遍历待预测的数据集,并基于基样本集确定重复数据和相似数据,从而计算数据冗余的估计值。本发明能够有效地提高云存储冗余数据的去重性能。

基本信息
专利标题 :
一种基于相似数据检测的云存储冗余数据预测方法和设备
专利标题(英):
暂无
公开(公告)号 :
CN114579362A
申请号 :
CN202210182503.X
公开(公告)日 :
2022-06-03
申请日 :
2022-02-25
授权号 :
暂无
授权日 :
暂无
发明人 :
田纹龙刘琪菲耿雨晴万亚平欧阳纯萍李跃刘洋何婷婷
申请人 :
南华大学
申请人地址 :
湖南省衡阳市常胜西路28号
代理机构 :
武汉知产时代知识产权代理有限公司
代理人 :
郝明琴
优先权 :
CN202210182503.X
主分类号 :
G06F11/14
IPC分类号 :
G06F11/14  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F11/00
错误检测;错误校正;监控
G06F11/07
响应错误的产生,例如,容错
G06F11/14
用运算中的冗余作数据的错误检测或校正,例如,通过采用导致相同结果的不同运算序列
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332