教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> 论文> 其他论文> LHARC中的动态限长编码压缩算法

LHARC中的动态限长编码压缩算法

上传者:网友
|
翻新时间:2013-12-18

LHARC中的动态限长编码压缩算法

LHARC中的动态限长编码压缩算法 LHARC中的动态限长编码压缩算法 LHARC中的动态限长编码压缩算法摘 要 该文对DOS下常用的数据压缩软件LHARC的算法进行了分析。该算法中采用了一种动态限长变化的不等长编码方法,使最短码2位,而最长码不超过8位,达到了最佳压缩效果。

一、前言

LHARC是DOS下的数据压缩软件之一,与同类软件如ARJ、PKZIP、PKARC等相比,具有如下几个特点。

1.压缩比高

LHARC采用先进的字符串自适应压缩与单个字符的限长变化编码压缩相结合的方法,对文件进行双重压缩,尽可能地减少了冗余,对各类文件的压缩效果都很好。

2.保密性好

除应具有保存文件、节约存储空间的功能外,提高数据的保密性也是压缩软件的一个重要功能。LHARC由于采取了与众不同的动态限长编码压缩技术,使字符与其压缩代码之间无固定的对应关系,压缩后的数据更具保密性。

3.软件短小精悍

LHARC整个软件集压缩、还原于一身,只有30余K,而其它同类软件均有100余K。

LHARC的基本压缩原理是,将待压缩文件看作是字符流(字节流),将其中的冗余信息分成两类:

(1) 同一字符的离散出现

如 abcda……

这里,字符a出现了两次。

2.字符串的重复出现

如 abcdabcd……或abcd…abcd……

这里,字符串abcd出现了两次。值得说明的是,这里串的概念是LZW方法意义下的,即将字符流中每一字符均看作是一个串的起始字符。

压缩时,首先对字符流中的字符串进行识别,将其中的重复串用压缩格式记载,然后再将处理后的数据用不等长编码进行代码变换及压缩。下面仅就其中的动态限长变化编码方法进行介绍。

二、动态限长编码方法

1.基本原理

经重复串压缩后的数据中,重复串已大大减少,而同一字符的分布式冗余问题则比较突出。由于256个字符的使用概率一般不同,往往相差悬殊,若采用不等长编码,将高频字符用较短代码表示,低频字符用较长码表示,则提高了整体的压缩比。在一般的数据压缩过程中,Haffman编码的算法实现为:先统计出待压文件中各字符的出现概率,据此动态建立一棵Haffman树,并以二分树的序列形式存入压缩数据文件首部以用于还原过程。在压缩过程中,由Haffman树实现字符的ASCII码(等长码)与其压缩代码(Haffman不等长码)的转换。这种处理方法需对待压缩文件进行两遍扫描,且Haffman树须保存于压缩数据文件中而占用额外的存储空间。2.压缩的实现及码树的调整

压缩前动态建立一棵初始译码树,每个叶结点对应一个字符。由于压缩前可以认为各字符的出现概率相等,故初始码树应为一有256片叶子的平衡二叉树,如图1所示。显然每个字符的初始代码长度均为8位。

@@09A04900.GIF;图1 初始译码树@@代码长度缩减的规律是:设n为字符当前所在层数,则当字符的重复出现次数为28-n时,代码长度减少1位。

代码长度的缩减会带来一个十分关键的问题:当码树各结点值是静态的时候,一字符对应了某一高层结点后,此结点的所有下层枝叶将不能再对应其它字符,否则一些代码将是另一些代码的前缀,这将使还原过程无法进行。因此代码缩减将使编码路径数减少,一些后继字符将无法由码树编码。为此,该算法采取的策略是:按字符出现的次序将它们集中排列在码树的一侧叶子上,通过移动和交换分枝点之值的方法,使各层结点之值重新组合,从而使被占用结点的下属枝叶可“稼接”到未用的结点上。因此,当高层结点被占用后,其下属结点仍可使用,不会减少编码路径数。具体来说,当一后继字符出现并且其对应叶子的父结点已被占用,它将改变原有的编码路径,通过搜索找出一个未用的上层结点并由此得到其代码。

同样,当一字符须上升一层时,并不是升到其父结点中,而是升到上层中一个未用过的结点之中。当该字符再度出现时,它将沿新路径得到其代码,此代码的长度不仅为原代码长度减1,而且此代码的各个位也与原代码不同。下面以一具体例子加以说明。

设字符串为ababcabdabc……各字符的编码路径如图2所示。其中的Xi表示X的第i次出现。由此可看出,由该算法给出的编码方法是逐步达到最佳码长的。一字符的压缩代码不仅与字符出现的次数有关(长度不同),而且与字符在文件中的位置有关(编码路径不同)。

LHARC建立了两个表专门用来记录码树的占用情况及各字符出现的次数,以便确定对码树的各种调整。当压缩后的数据达到32K时,将对表及码树进行“重组”,删除表中部分累积的数据后再继续进行压缩,以后将每隔16K“重组”一次。

下载文档

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

网友最新关注

放风筝
春天到了
我的“虫”爸爸
可爱的猪
下雪了
快乐的一天
国色天香游记
精彩的演出
拔河比赛
粗心的我
接力赛
假如
老师是一朵母亲花!
我想……
三八妇女节
六一儿童节活动安全方案
教师读书学习规划
大学四年个人目标计划
小学教师新学期计划
三年大学生涯个人发展规划
县第六次人口普查户口整顿方案
关于社会治安综合治理宣传月活动策化方案
教育教学工作执行方案
党性分析个人整改措施
小学生迎“六一”儿童节作文竞赛方案
教育系统普法教育工作要点
高考安全保卫方案
乡镇廉政建设实施意见
大学新任班长新学期工作规划
整治不良风气方案
作为艺术家的易卜生:易卜生与中国重新思考(会员资料)
我国军婚保护制度的法理解说(1)论文
依靠直觉进行儿童美术教育的探索
天地大舞台——解析义和团运动戏剧性格的启示
理想与人道的二律背反——解读话剧《切·格瓦拉》
意大利法中违约解除效果实证考察(1)论文
中国政府体制改革的过去与未来
村庄选举研究的两种进路
超越主体论文艺学—新整体论文艺学论纲 (会员资料)
大众文化·文化殖民·媒介帝国主义
民主制度与经济发展的相互关系
论我国《公司法》对中小股东权益的保护(1)论文
政府的规模与范围(中)
市政道路上的井盖致人损害赔偿责任承担问题研究(1)论文
民事诉讼简易程序比较研究(1)论文
《小壁虎借尾巴》教案
《四个太阳》教学设计
《自己去吧》教学片断及反思
《秋天的图画》教学设计
《小白兔和小灰兔》教案
《要下雨了》教案
《乌鸦喝水》教案
《王二小》教案
《四季》教案(新课标)
《两只小狮子》教案
《四季》教学设计(第一课时)
《比尾巴》教学设计
《阳光》教案(新课标)
《我选我》教案
《“红领巾”真好》教案