当前位置：文档之家› 数据压缩笔记

数据压缩笔记

数据压缩编码理论读书心得
姓名：赵利英
学号：2011522116
专业：信号与信息处理
数据压缩读书心得
这学期我们学习了数据压缩这门课程，我更深刻地理解了信息论，最主要的是这些知识都是随处可见的，下面我们来看一下我们日常生活中常用的压缩软件。

一常用的压缩软件
1.文件压缩软件
(1)Winzip：知名度最高、使用率最高的压缩软件。

该软件界面简洁友好，特别是鼠标右键的直觉式压缩是一大特色。

(2)WinArj：方便实用，其压缩比高于Winzip。

(3)WinRAR：也与Winzip、WinArj齐名，3种软件中压缩比最高的一种文件压缩软件。

(4)WinPack：集各家软件之大成的全方位的压缩软件。

该软件可压缩出zip、Arj、RAR等压缩文件格式，还可将这些文件格式进行互换。

2.声音压缩软件
(1)Windows系统附件中的“录音机”：可通过设定采样频率压缩出3种不同的PCM文件。

文件量最小的适合压缩说话声音。

(2)MP3 Compressor：该软件界面友好，操作简便，压缩时间短，其最大的特色是将WA V文件压缩成MP3文件后可直接在附件的“录音机”中播放。

(3)Real Encoder：可将WA V或MP3等声音文件压缩成RA（Real Audio）网上即时传输文件，需要Real Player播放。

(4)超级解霸：将WA V、MPEG文件压缩为MP3文件。

3.图像压缩软件
(1)JPGE SmartSaver：可将其他格式的图像文件压缩成最佳化的文件量较小的JPEG文件。

(2)GIF SmartSaver：可将其他格式的图像文件压缩成最佳化的文件量较小的GIF文件。

(3)Animation SmartSaver：可将动态的GIF格式的图像文件最佳化成文件量较小的同格式文件。

4.视频压缩软件
(1)Ulead Mediostudio：可将一个未压缩的A VI文件压缩成具有压缩格式的
A VI文件。

当其压缩比达到1/18时，画质没有太明显的差别。

(2)Ulead MPEG Converter：可将一个A VI文件压缩成MPEG文件。

当其压缩比达到1/20时画质还相当不错，但压缩时间较长。

(3)XingMPEG Encoder：可将一个A VI文件压缩成MPEG文件。

(4)Real Encoder：可将A VI视频文件压缩成RM（Real Video）网上即时传输文件，需要Real Player播放。

(5)超级解霸：可将A VI文件压缩为MPEG文件。

二数据压缩的技术指标
1.数据压缩的目的
通过压缩手段把数据量压下来以压缩形式存储和传输，这样既节约了空间，又提高了传输速率，同时也使计算机可实时处理音频视频信息，以保证播放出高质量的音频、视频节目称为可能。

对图像的压缩编码有多种方法。

如亚采样编码思想：一组像素可用一个像素表示以达到压缩图像存储容量。

又如游程编码思想：对黑白图像的编码，可将每行的像素分为白段、黑段、白段、黑段、白段…后，每段像素采用其长度（计数）表示：计数1，计数2，计数3，
计数4，计数5，计数6…。

实际上，一个好的编码系统都是采用多种算法、多
次处理而成的。

2.数据压缩的基本理论
数据压缩是通过去除多媒体中冗余数据可大大减少原始数据量，从而使数
据量得到压缩。

信息论认为：若信源编码的熵（entropy）大于信源的实际熵，
则该信源一定存在冗余。

去除冗余不会减少信息量，仍可原样恢复数据；但若
减少了熵，则数据不能完全恢复。

不过在允许的范围内损失一定的熵，数据可
得到近似的恢复。

所谓“熵”，原指热能除以温度所得的商，即热量转化为功的程度。

这里
是指信源发出任意一个随机变量的平均信息量。

所谓“信息量”是指从N个相
等可能事件中选出一个事件所需的信息度量。

3.原始数据的冗余类型
(1)空间冗余：同一帧画面中，规则景物和规则背景的表面各采样点的颜色
之间存在空间连贯性。

(2)时间冗余：在图像序列中，相邻帧图像之间同一场景所包含背景和移动
物体具有共同性。

(3)结构冗余：图像的像素值存在明显的分布模式结构产生的数据冗余。

(4)知识冗余：某些规律性结构可通过先验知识和背景知识得到的冗余。

(5)视觉冗余：人眼的视觉系统对图像场视觉的敏感和不敏感同等对待而产生了更多数据冗余。

(6)区域相似性冗余：图像中的两个或多个区域所对应的像素值具有相似性使产生的数据重复存储
(7)纹理的统计冗余：图像纹理在统计上服从某一分布规律的冗余。

4.压缩比
压缩比（%）=压缩后的图像数据量/ 压缩前的图像数据量
若原数字文件数据容量为100MB，经压缩后的数据容量为50MB，则图像压缩比为50%。

显然，压缩比越小，压缩后的图像文件数据量也越小，图像的质量有可能损失越多。

实际上，图像的压缩效果不但与压缩前的图像效果有关，也与采用的压缩方法有关。

5.数据压缩的技术指标
(1)压缩比：压缩前、后所需的信息存储量之比要大。

(2)压缩和解压速度：实现数据压缩的算法要简单，压缩解压的速度要快。

(3)恢复效果：解压后的恢复效果要好，要尽可能地恢复原始数据。

三数据压缩编码方法的分类
1.根据熵有无损失分类
(1)无损压缩
无损压缩也称为不失真压缩，是去掉或减少数据的冗余进行压缩。

这些冗余值可重新插入数据中来实现原始数据的完全恢复而不失真。

但这种压缩方法的压缩比受到统计冗余度的理论限制，一般为2：1-5：1。

该压缩方法适用于文本、数据、程序和应用场合的图像数据的压缩。

常用无损压缩的编码方案有：
游程编码、Huffman编码、算术编码及LZW编码等。

(2)有损压缩
有损压缩也称为有失真压缩，是减少信息量（压缩熵）来进行压缩。

这些损失是不能再恢复的，因此这种压缩是不可逆的。

一般利用人的视觉和听觉对图像或声音中的不敏感性进行压缩，虽损失一息且不能完全恢复原始数据，但换取了高的压缩比。

该压缩方法适用于语音数据、图像数据和视频数据的压缩。

常用有损压缩的编码方案有：PCM、预测编码、变换编码、插值及外推法编码等。

2.根据数据压缩算法分类
(1)统计编码
统计编码也称信息熵编码，是根据信源所含有的平均信息量（熵）即无失真编码的极限的无失真编码定理进行编码。

统计编码常用的是Huffman编码（利用信源概率分布）、游程编码（利用相关性）和算术编码（利用信源概率分布）等。

(2)预测编码
预测编码是根据某一数据模型利用以往样本值对新样本值进行预测，再将样本实际值与预测值的差进行编码。

若模型足够好，且样本序列的时间相关性较强，则误差信号幅度将远小于原始信号，即可用较少的值对其差值进行量化，得到较大压缩的效果。

预测编码常用的是差分脉冲编码调制（DPCM）和自适应的差分脉冲编码调制（ADPCM）。

(3)变换编码
变换编码将通常在空间域描写的图像信号变换到另外一些正交矢量空间（即
变化域）中进行描写。

选择合适的变换关系使变换域中描写的各信息分量之间的相关性很小或互不相关，从而达到数据压缩的目的。

(4)分析合成编码
分析合成编码是通过对原始数据的分析，将其分解为一系列更适合表示的基元或从中提取若干具有更本质意义的参数，编码仅针对这些基本单元或特征参数进行。

解压时则借助一定的规则或模型按一定的算法将这些基元或参数再合成逼近原始数据的数据。

常用的编码有子带编码、小波变换编码以及分析图形编码等。

三数据压缩技术的发展趋势
数据压缩新技术主要有两种：1.基于分形的压缩方法；2.小波变换在图像压缩中的应用。

当前，压缩域数据处理技术作为星星的技术还远未成熟，许多问题有待解决，其中缺乏统一的理论支持是主要问题。

未来的研究工作将主要集中在四个方面：(1)设计新的压缩算法，支持对压缩域数据直接操作；(2)研究用小波、矢量量化、分形等方法压缩的多媒体数据的压缩域处理算法；(3)设计专用的压缩域数据处理芯片；(4)如何将用于多媒体内容的传输和使用的各种标准结合起来，形成一个用于多媒体的统一的体系结构。

未来多媒体数据压缩技术的发展趋势将是基于内容的压缩。

另外，图像压缩技术、视频技术与网络技术相结合的应用前景十分可观，如远程图像传输系统、动态视频传输(可视电话)、电视会议系统等已经开始商品化，MPEG标准与视频技术相结合的产品——家用数字视盘机、VideoCD系统等都已进入市场。

可以预计，这些技术和产品的发展将对21世纪的社会进步产生重大的影响。

参考文献
[1]《多媒体数据压缩技术的现状及应用展望》张磊，邹永星，武剑
[2]《多媒体技术基础》林福宗清华大学出版社
[3]《数据压缩原理与应用(第二版)》吴乐南电子工业出版社
[4]《Introduction to Data Compression Third Edition》Khalid Sayood 人民邮电出版社。

e商务文档

数据压缩笔记

相关文档推荐：