基于最优匹配模型的数据库压缩算法
摘 要: 针对数据库中数据急速膨胀的状况,提出一种新的适用于语义压缩的数据库压缩算法——基于最优匹配的OPMC算法。算法将数据表中的属性元组分类并进行最优匹配的筛选为每类选取一个代表元组,将数据集中到最优匹配的聚类中心点上,消除相似的、冗余的数据,从而实现数据的压缩。该算法经仿真实验验证,有效改善了压缩比率,相对其他算法的压缩比率提高18%。 数据库正在急速膨胀成应用系统中巨大的组成部分,吞噬着系统的性能。当单一数据库逐步膨胀为PB容量时,要查询到适当的存储内容就会越来越困难。每个数据表的容量正在迅速膨胀,数百万行的数据表正在膨胀为数十亿行的大规模数据表,还需要额外的空间来备份所有这
下载地址
用户评论