当前位置：文档之家› 数据压缩与编码技术

数据压缩与编码技术

时间冗余示例
多媒体技术基础与应用
视觉冗余

视觉冗余是针对人眼的视觉特性而言的。人对图像的敏感性是非均匀、非线性的，例如视觉系统对亮度比对色度敏感，对低频信号比对高频信号敏感等特性。
多媒体技术基础与应用
多媒体数据压缩的分类
多媒体技术基础与应用
无损压缩
无损压缩算法是为保留原始多媒体对象（包括图像、语音和视频）而设计的。在无损压缩中，数据在压缩或解压缩过程中不会改变或损失，解压缩产生的数据是对原始对象的完整复制。
多媒体技术基础与应用
第三代编码技术
近年来，出现了一类充分利用人类视觉特
性的编码方法，有人称之为第三代编码技术，如小波变换的编码。这类方法使用不同类型的线性数字滤波方法，对视频（图像）进行整体的分解，然后根据人类视觉特性对不同频段的数据进行粗细不同的量化处理，以达到更好的压缩效果。
多媒体技术基础与应用
多媒体技术基础与应用
香农-范诺编码示例分析
多媒体技术基础与应用
香农-范诺编码步骤
多媒体技术基础与应用
香农-范诺编码示例

在最终得到的编码树中，拥有较大频率的3个符号（ADB）被两位编码，其他两个频率较低的符号（EC）被三位编码。如下表所示：
多媒体技术基础与应用
霍夫曼编码步骤
1.信源符号按概率递减顺序排列； 2.把两个最小的概率加起来，作为新符号的概率； 3.重复步骤⑴与⑵，直到概率和等于1为止； 4.完成上述步骤后，再沿路径返回进行编码。
多媒体技术基础与应用
有损压缩
有损压缩是指使用压缩后的数据进行重构，
重构后的数据与原来的数据有所不同，但不会使人对原始资料表达的信息造成误解。通常声音、图像与视频的数据压缩都采用有损压缩。有损数据压缩方法通常需要在压缩速度、压缩数据大小以及质量损失这三者之间进行折衷。
多媒体技术基础与应用
多媒体技术基础与应用
离散余弦变换的理解

源图像在进行DCT变换之前，首先把源图像划分为若干个8×8像素的子块，然后对8×8像素块逐一进行FDCT变换。例如，如果源图像为 640480的分辨率（即由640480像素组成，则划分后的图像将包含8060这样多的子块。
多媒体技术基础与应用
离散余弦变换的理解
多媒体技术基础与应用
数据压缩与编码的基本概念
信息冗余是传输消息所用数据位的数目与
消息中所包含的实际信息的数据位的数目的差值。数据压缩是一种用来消除不需要的冗余的方法。多媒体数据存在大量的冗余，通过去除那些冗余数据可以使原始数据极大地减少，因此，多媒体数据压缩编码技术就是研究如何利用多媒体数据的冗余性来减少数据量的方法。
多媒体技术基础与应用
离散余弦变换

离散余弦变换(DCT：Discrete Cosine Transformation)具有快速算法，且易于实现等优点，它的快速算法已可由专用芯片来实现，因而被广泛采用。离散余弦变换方法研究较早，技术成熟，图像压缩实践证明DCT是许多图像的最佳变换，它允许将88图像的空间表达式转换为频率域，只需要少量的数据点来表示图像。
多媒体技术基础与应用
离散余弦变换

DCT压缩过程中最关键的步骤是一个称为 DCT的数学变换。DCT和著名的快速傅立叶变换（FFT）属于同一类数学运算，这类变换的基本运算是将信号从一种表达形式变成另一种表达形式，并且这种变换过程是可逆的，即在两个变换过程中除开舍入误差和截断误差，本质是无损失的。
多媒体技术基础与应用
DPCM工作原理方框图
多媒体技术基础与应用
自适应差分脉冲编码-ADPCM

自适应差分脉冲编码就是使量化间隔大小的变化自动地去适应输入信号大小的变化。它根据信号分布不均匀的特点，使系统具有随输入信号的变化而改变量化区间的大小，以保持输入量化器的信号基本均匀的能力。自适应量化必须具有对输入信号的幅值进行估计的能力，有了估值才能确定相应的改变量。若估值在信号的输入端进行，称前馈自适应；若在量化输出端进行，称反馈自适应。
多媒体技术基础与应用
离散余弦变换的理解

假设每个像素的灰度值（或颜色值）用8比特来表示，那么共有256个灰度等级（0~255）。这样，可以定义一个8行×8列的二维矩阵P来表示图像子块中各像素的灰度值和颜色值(P[x][y]表示第x行第y列的值)，利用离散余弦变换公式，于是可得到变换以后的频率域矩阵Ｔ。
多媒体技术基础与应用
离散余弦变换的理解
多媒体技术基础与应用
小波变换

顾名思义，“小波”就是小区域、长度有限、均值为0的波形。所谓“小”是指它具有衰减性；而称之为“波”则是指它的波动性，其振幅正负相间的震荡形式。与傅立叶变换相比，小波变换是时间(空间)频率的局部化分析，它通过伸缩平移运算对信号(函数)逐步进行多尺度细化（Multiscale Analysis），最终达到高频处时间细分，低频处频率细分，能自动适应时频信号分析的要求，从而可聚焦到信号的任意细节，解决了傅立叶变换不能解决的许多困难问题，
多媒体技术基础与应用
霍夫曼编码示例分析
多媒体技术基础与应用
霍夫曼编码示例
多媒体技术基础与应用
平均码长和信源符号的信息熵H(x)
多媒体技术基础与应用
行程编码

在一幅图像中具有许多颜色相同的图块。在这些图块中，许多行上都具有相同的颜色，或者在一行上有许多连续的像素都具有相同的颜色值。不需要存储每一个像素的颜色值，而仅仅存储一个像素的颜色值，以及具有相同颜色的像素数目即可，这种压缩编码称为行程长度编码，用 RLE(Run Length Encoding)表示。
多媒体技术基础与应用
“第二代”编码方法
“第一代”编码技术只是以信息论和数字信号处理技术为理论基础，旨在去除图像数据中的线性相关性的一类编码技术。 “第二代”编码技术充分利用人的视觉生理、心理和图像信源的各种特征，实现从“波形”编码到 “模型”编码的转变，以便获得更高压缩比。 “第二代”编码方法主要有：基于分形的编码、基于模型的编码、基于区域分割的编码和基于神经网络的编码等。
多媒体技术基础与应用
一些术语和概念
压缩(compress)
解压缩/还原/重构(decompress) 编码(encode/coding)
解码/译码(decode)
多媒体技术基础与应用
信息冗余的几种形式
信息熵冗余

为表达数据需要用一系列符号，用这些符号根据一定的规则来表达就是对数据的编码。对每个信息或事件所赋的符号序列称为码字，而每个码字里的符号个数称为码字的长度。
多媒体技术基础技术基础与应用
算术编码的示例
多媒体技术基础与应用
信源的算术编码过程
多媒体技术基础与应用
信源的算术编码过程
多媒体技术基础与应用
10.3 预测编码

预测编码是有损数据压缩理论的一个重要分支，它是根据离散信号之间存在着一定的相关性，利用前面的一个或多个信号对下一信号进行预测，然后对实际值和预测值的差进行编码。
1948年，Oliver提出了第一个编码理论——脉冲
编码调制；同年，Shannon的经典论文——“通信的数学原理”首次提出并建立了信息率失真函数概念；1959年，Shannon进一步确立了码率失真理论，以上工作奠定了信息编码的理论基础。主要编码方法有预测编码、变换编码和统计编码，也称为三大经典编码方法。经典编码技术又可以称为“第一代”编码技术。
第10章数据压缩与编码技术
10.1 数据压缩编码技术概述
10.2 无失真压缩编码
10.3 预测编码
10.4 变换编码
10.5 其他编码
多媒体技术基础与应用
10.1 数据压缩编码技术概述
信息为什么能压缩? 从信息论的角度来看，压缩就是去掉信息
中的冗余，即保留不确定的信息，去除确定的信息(可推知的)，也就是用一种更接近信息本质的描述来代替原有冗余的描述。
多媒体技术基础与应用
行程编码示例
例如对一个由16*10像素组成的小图像，每个小格表示一个像素，设每个像素的颜色值用8位表示，试用行程编码表示。
多媒体技术基础与应用
行程编码示例
多媒体技术基础与应用
算术编码的基本思想

实现算术编码首先需要知道信源发出每个符号的概率大小，然后再扫描符号序列，依次分割相应的区间，最终得到符号序列所对应的码字。整个编码需要两个过程，即概率模型建立过程和扫描编码过程。显然，一串符号序列发生的概率越大，对应的子区间就越宽，要表达它所用的比特数就减少，因而相应的码字就越短。
多媒体技术基础与应用
空间冗余
空间冗余是静态图像中最主要的一种冗余。例如，通常的图像都描述了某个场景，其相邻像素点之间存在一定的空间连贯性。如果编码时不考虑这一相关性，就会造成空间冗余。由于任何给定的像素值，原理上都可以通过它的邻域值预测到，单个像素携带的信息相对是小的。对于一个图像，很多单个像素对视觉的贡献是冗余的。
多媒体技术基础与应用
DPCM-差分脉冲编码

DPCM（Differential Pulse Code Modulation，差分脉冲编码调制）与PCM不同，它编码的不是采样样本值，而是样本值及其预测值的差分，即量化的是已知的样本值与预测值之间的差值。DPCM是从过去的几个采样值的线性组合来预测推断现在的采样值，进而用实际采样值与预测采样值之差（称作预测误差）及线性预测系数进行编码，从而达到信息压缩的一种方法。
多媒体技术基础与应用
ADPCM编码框图
多媒体技术基础与应用
10.4 变换编码

e商务文档

数据压缩与编码技术

相关文档推荐：