数据压缩与编码技术
时间冗余示例
多媒体技术基础与应用
视觉冗余
视觉冗余是针对人眼的视觉特性而言的。 人对图像的敏感性是非均匀、非线性的, 例如视觉系统对亮度比对色度敏感,对低 频信号比对高频信号敏感等特性。
多媒体技术基础与应用
多媒体数据压缩的分类
多媒体技术基础与应用
无损压缩
无损压缩算法是为保留原始多媒体对象 (包括图像、语音和视频)而设计的。在无 损压缩中,数据在压缩或解压缩过程中不会 改变或损失,解压缩产生的数据是对原始对 象的完整复制。
多媒体技术基础与应用
第三代编码技术
近年来,出现了一类充分利用人类视觉特
性的编码方法,有人称之为第三代编码技 术,如小波变换的编码。这类方法使用不 同类型的线性数字滤波方法,对视频(图 像)进行整体的分解,然后根据人类视觉 特性对不同频段的数据进行粗细不同的量 化处理,以达到更好的压缩效果。
多媒体技术基础与应用
多媒体技术基础与应用
香农-范诺编码示例分析
多媒体技术基础与应用
香农-范诺编码步骤
多媒体技术基础与应用
香农-范诺编码示例
在最终得到的编码树中,拥有较大频率的3个 符号(ADB)被两位编码,其他两个频率较低的 符号(EC)被三位编码。如下表所示:
多媒体技术基础与应用
霍夫曼编码步骤
1.信源符号按概率递减顺序排列; 2.把两个最小的概率加起来,作为新符号 的概率; 3.重复步骤⑴与⑵,直到概率和等于1为 止; 4.完成上述步骤后,再沿路径返回进行编 码。
多媒体技术基础与应用
有损压缩
有损压缩是指使用压缩后的数据进行重构,
重构后的数据与原来的数据有所不同,但 不会使人对原始资料表达的信息造成误解。 通常声音、图像与视频的数据压缩都采用 有损压缩。有损数据压缩方法通常需要在 压缩速度、压缩数据大小以及质量损失这 三者之间进行折衷。
多媒体技术基础与应用
多媒体技术基础与应用
离散余弦变换的理解
源图像在进行DCT变换之前,首先把源图像 划分为若干个8×8像素的子块,然后对8×8像素 块逐一进行FDCT变换。例如,如果源图像为 640480的分辨率(即由640480像素组成,则划 分后的图像将包含8060这样多的子块。
多媒体技术基础与应用
离散余弦变换的理解
多媒体技术基础与应用
数据压缩与编码的基本概念
信息冗余是传输消息所用数据位的数目与
消息中所包含的实际信息的数据位的数目 的差值。数据压缩是一种用来消除不需要 的冗余的方法。 多媒体数据存在大量的冗余,通过去除那 些冗余数据可以使原始数据极大地减少, 因此,多媒体数据压缩编码技术就是研究 如何利用多媒体数据的冗余性来减少数据 量的方法。
多媒体技术基础与应用
离散余弦变换
离散余弦变换(DCT:Discrete Cosine Transformation)具有快速算法,且易于实现等 优点,它的快速算法已可由专用芯片来实现,因 而被广泛采用。离散余弦变换方法研究较早,技 术成熟,图像压缩实践证明DCT是许多图像的最 佳变换,它允许将88图像的空间表达式转换为频 率域,只需要少量的数据点来表示图像。
多媒体技术基础与应用
离散余弦变换
DCT压缩过程中最关键的步骤是一个称为 DCT的数学变换。DCT和著名的快速傅立叶变换 (FFT)属于同一类数学运算,这类变换的基本 运算是将信号从一种表达形式变成另一种表达形 式,并且这种变换过程是可逆的,即在两个变换 过程中除开舍入误差和截断误差,本质是无损失 的。
多媒体技术基础与应用
DPCM工作原理方框图
多媒体技术基础与应用
自适应差分脉冲编码-ADPCM
自适应差分脉冲编码就是使量化间隔大小的 变化自动地去适应输入信号大小的变化。它根据 信号分布不均匀的特点,使系统具有随输入信号 的变化而改变量化区间的大小,以保持输入量化 器的信号基本均匀的能力。自适应量化必须具有 对输入信号的幅值进行估计的能力,有了估值才 能确定相应的改变量。若估值在信号的输入端进 行,称前馈自适应;若在量化输出端进行,称反 馈自适应。
多媒体技术基础与应用
离散余弦变换的理解
假设每个像素的灰度值(或颜色值)用8比特 来表示,那么共有256个灰度等级(0~255)。这 样,可以定义一个8行×8列的二维矩阵P来表示 图像子块中各像素的灰度值和颜色值(P[x][y]表示 第x行第y列的值),利用离散余弦变换公式,于是 可得到变换以后的频率域矩阵T。
多媒体技术基础与应用
离散余弦变换的理解
多媒体技术基础与应用
小波变换
顾名思义,“小波”就是小区域、长度有限、 均值为0的波形。所谓“小”是指它具有衰减性; 而称之为“波”则是指它的波动性,其振幅正负 相间的震荡形式。与傅立叶变换相比,小波变换 是时间(空间)频率的局部化分析,它通过伸缩平 移运算对信号(函数)逐步进行多尺度细化 (Multiscale Analysis),最终达到高频处时间 细分,低频处频率细分,能自动适应时频信号分 析的要求,从而可聚焦到信号的任意细节,解决 了傅立叶变换不能解决的许多困难问题,
多媒体技术基础与应用
霍夫曼编码示例分析
多媒体技术基础与应用
霍夫曼编码示例
多媒体技术基础与应用
平均码长和信源符号的信息熵H(x)
多媒体技术基础与应用
行程编码
在一幅图像中具有许多颜色相同的图 块。在这些图块中,许多行上都具有相同 的颜色,或者在一行上有许多连续的像素 都具有相同的颜色值。不需要存储每一个 像素的颜色值,而仅仅存储一个像素的颜 色值,以及具有相同颜色的像素数目即可, 这种压缩编码称为行程长度编码,用 RLE(Run Length Encoding)表示。
多媒体技术基础与应用
“第二代”编码方法
“第一代”编码技术只是以信息论和数字信号处 理技术为理论基础,旨在去除图像数据中的线性相 关性的一类编码技术。 “第二代”编码技术充分利用人的视觉生理、心理 和图像信源的各种特征,实现从“波形”编码到 “模型”编码的转变,以便获得更高压缩比。 “第二代”编码方法主要有:基于分形的编码、 基于模型的编码、基于区域分割的编码和基于神 经网络的编码等。
多媒体技术基础与应用
一些术语和概念
压缩(compress)
解压缩/还原/重构(decompress) 编码(encode/coding)
解码/译码(decode)
多媒体技术基础与应用
信息冗余的几种形式
信息熵冗余
为表达数据需要用一系列符号,用这些符号 根据一定的规则来表达就是对数据的编码。对每 个信息或事件所赋的符号序列称为码字,而每个 码字里的符号个数称为码字的长度。
多媒体技术基础技术基础与应用
算术编码的示例
多媒体技术基础与应用
信源的算术编码过程
多媒体技术基础与应用
信源的算术编码过程
多媒体技术基础与应用
10.3 预测编码
预测编码是有损数据压缩理论的一个重 要分支,它是根据离散信号之间存在着一 定的相关性,利用前面的一个或多个信号 对下一信号进行预测,然后对实际值和预 测值的差进行编码。
1948年,Oliver提出了第一个编码理论——脉冲
编码调制;同年,Shannon的经典论文——“通 信的数学原理”首次提出并建立了信息率失真函 数概念;1959年,Shannon进一步确立了码率失 真理论,以上工作奠定了信息编码的理论基础。 主要编码方法有预测编码、变换编码和统计编 码,也称为三大经典编码方法。经典编码技术又 可以称为“第一代”编码技术。
第10章 数据压缩与编码技术
10.1 数据压缩编码技术概述
10.2 无失真压缩编码
10.3 预测编码
10.4 变换编码
10.5 其他编码
多媒体技术基础与应用
10.1 数据压缩编码技术概述
信息为什么能压缩? 从信息论的角度来看,压缩就是去掉信息
中的冗余,即保留不确定的信息,去除确 定的信息(可推知的),也就是用一种更接 近信息本质的描述来代替原有冗余的描述。
多媒体技术基础与应用
行程编码示例
例如对一个由16*10像素组成的小图像,每个小 格表示一个像素,设每个像素的颜色值用8位表示, 试用行程编码表示。
多媒体技术基础与应用
行程编码示例
多媒体技术基础与应用
算术编码的基本思想
实现算术编码首先需要知道信源发出每个符 号的概率大小,然后再扫描符号序列,依次分割 相应的区间,最终得到符号序列所对应的码字。 整个编码需要两个过程,即概率模型建立过程和 扫描编码过程。显然,一串符号序列发生的概率 越大,对应的子区间就越宽,要表达它所用的比 特数就减少,因而相应的码字就越短。
多媒体技术基础与应用
空间冗余
空间冗余是静态图像中最主要的一种冗余。例如, 通常的图像都描述了某个场景,其相邻像素点之间 存在一定的空间连贯性。如果编码时不考虑这一相 关性,就会造成空间冗余。 由于任何给定的像素值,原理上都可以通过它 的邻域值预测到,单个像素携带的信息相对是小的。 对于一个图像,很多单个像素对视觉的贡献是冗余 的。
多媒体技术基础与应用
DPCM-差分脉冲编码
DPCM(Differential Pulse Code Modulation,差分脉冲编码调制)与PCM不同, 它编码的不是采样样本值,而是样本值及其预测 值的差分,即量化的是已知的样本值与预测值之 间的差值。DPCM是从过去的几个采样值的线性 组合来预测推断现在的采样值,进而用实际采样 值与预测采样值之差(称作预测误差)及线性预 测系数进行编码,从而达到信息压缩的一种方法。
多媒体技术基础与应用
ADPCM编码框图
多媒体技术基础与应用
10.4 变换编码