当前位置:文档之家› 第三章 数据压缩的基本技术

第三章 数据压缩的基本技术


3.2.2信源的相关性与序列熵的关系 平稳序列:序列中的各符号有相同的概率分布; 无记忆序列:序列中的各符号间为统计独立; 联合熵:又称序列熵,随机序列中包含两个符号X、Y, X、Y取自各自的离散信源,则新序列的平均信息量为
独立熵:离散信源X、Y如果统计独立,则H(X)、 H(Y)称为独立熵。 此时有:
逆DCT变换来重构原图像,不会引起明显误差,从而实 现数据压缩。
二维DCT变换
原图像 将基系数绝对值<10的分量置零 (DCT截断量化) 二维逆DCT变换 重构图像
图像清晰 (截断量化误差较小)
(数据压缩程度较小)
对DCT数据的截断量化示意图1
二维DCT变换
原图像 将基系数绝对值<100的分量置零 (DCT截断量化) 二维逆DCT变换 重构图像
•均匀量化(量化步长均匀);
•最小均方误差量化(非均匀量化,可使均方误差量化最
小);
•最小熵量化(使输出熵为最小值); •自适应量化(自动动态选择切换到步长不同的某一组均 匀量化器);
模数转换
模数转换,又称ADC(Analog-to-Digital Converter), 是将连续变化的、平滑的模拟量转化成采用二进制(0,1) 编码的数字量的过程。
i m i a 2 i n 1
其中 ai-取值只有两个数码:0和1 2i-为二进制的权,基数为2 n 为整数位的个数、m 为小数位的个数 如(11011.101)2=1×24 +1×23 +0×22 +1×21 +1×20
+1×2-1+0×2-2 +1×2-3 =(27.625)10
i m i a 10 i n 1
其中: ai-称为数制的系数,表示第i位的数码,十进制 数码为0 ~ 9 十个数; 10 i-表示第i位的权值,10为基数,即采用数码的 个数; n 为整数位的个数、m 为小数位的个数;
十进制数转换成二进制数
例如:
(249.56)10=2×102+ 4×101+ 9×100 + 5×10–1+ 2×10-2
·用差值信号和运动向量值来表示参照块与所预测块之间的
误差, 称为预测误差。
这时, 只需对当前块的预测误差(运动向量值、差值信号)
进行编码, 不必对当前块的图像进行编码, 以压缩时间冗余信息。
④ 如果找不到这样的匹配块, 则必须进行帧内编码, 即对当 前块的图像进行编码。 运动补偿预测编码可分成下列三种方式: ① 单向运动补偿预测: 只使用前参照帧或后参照帧之一进 行预测。 ② 双向运动补偿预测: 使用前、 后两个帧作为参照帧来计 算各块的运动向量, 最后只选择具有最小匹配误差的参照帧相
1 ( ) 0 ( ) 1 ( ) 1 ( ) 0 ( ) 1 ( ) 0 ( ) 1( )
图像模糊 (由截断量化误差引起)
(数据压缩程度大)
对DCT数据的截断量化示意图2
3.9 量化(Q量化,DQ反量化)
量化编码,也是属于有损编码,是信号数字化的重要的一
环,它是将连续幅度值的输入信号转换为有限个离散幅度
值的输出信号的过程,量化一般和编码结合在一起。
•改变量化步长,可以实时调节多媒体编码数据速率。 量化编码有:
二维DCT编码。
DCT 编码方法是对一个 8×8 图像块灰度样本数
据流进行压缩 , 而彩色图像压缩可看成是压缩图像的
多个分量。在编码器中 , 首先将源图像 8×8 样本数据
块(像素块)的取值范围由[0, 2p-1](无符号)转
换成[-2p-1, 2p-1-1](有符号), 其中p为样本定义的精
度。 然后对 8×8 样本数据块进行正向离散余弦变换
( FDCT ) 。 在 解 码 器 中 , 利 用 逆 向 离 散 余 弦 变 换
(IDCT)重建8×8样本数据块, 恢复图像。 FDCT和 IDCT的数学表达式如(1)式和(2)式所示:
二维DCT变换
DCT 系数
N 1 N 1 2 (2 j 1)u (2k 1)v S (u , ) C (u )C (v) s ( j , k ) cos cos N 2N 2N j 0 k 0
关的运动向量值。
③ 插值运动补偿预测: 使用前参照帧和后参照帧两者预测
值的平均值。这时, 必须分别存储和传输这两个运动向量。
3.6.2离散余弦变换编码
1、正交变换
正交变换:
重构:
i为正交基向量, 彼此之间线性无关
•如:傅氏变换的基向量,就是一个正交(酉)变换基;
2、DCT编码
属于正交变换编码,选择不同的正交基向量,可
十进制数转换成二进制数 ③十进制数 转换成 二进制数: 长除法 (即:整数除2取余) 十进制数的整数部分转换:将整数用基数2去除,保留 余数,再用商除2,依次下去,直到商为0为止,其余 数即为对应的二进制数的整数部分;
2 2 2 2 2 2 2 2 173 86 43 21 10 5 2 1 0
如:(173)10=>(10101101) 2
有损压缩编码是指解码后的数据与原始数据相比
有一定的偏差 , 但仍可保持一定的视听质量和效果。
它主要是在保持一定保真度下对数据进行压缩 , 其压
缩比可达100∶1。 压缩比愈高, 其解压缩后的视、 音
频质量就愈低。编码方法有:基于线性预测原理的预 测编码、基于分量量化的量化编码、基于正交变换原 理的正交变换编码、基于分层处理的分层编码以及基 于频带分割原理的子带编码等。主要用于对音频和视
其中n=3,m=2
十进制数转换成二进制数 ②二进制:进位规则是“逢二进一”,任意一个n位整 数、m位小数的二进制可表示为
( N ) 2 an 1an 2 ...a0 a1...a m an 1 2 n 1 ... ao 2 0 a1 2 1 ... a m 2 m
模数转换流程示意图
量化→二进制编码
十进制数转换成二进制数
①十进制:进位规则是“逢十进一”。任意一个n位整数、 m位小数的十进制数可表示为: ( N )10 an 1an 2 ...a0 a1...a m
an 1 10 n 1 ... ao 10 0 a1 10 1 ... a m 10 m
以得到不同的正交变换。变换编码主要有离散傅立叶
变换 (DFT) 编码、 离散余弦变换 (DCT) 编码等。其中 , DCT编码方法被普遍使用, 在JPEG、 MPEG和H.261等 标准中都采用了 DCT 编码。由于声音信号只有一个时 间维, 因此音频信号压缩采用一维 DCT编码, 而图像压
缩必须考虑水平和垂直两个方向, 因此图像压缩则采用
频数据的压缩。
多媒体信息编码技术主要侧重于有损压缩编码的研
究。 经过多年的研究与开发, 已经出台了一系列有关的
国际标准。其中 最著名的是国际标准组织(ISO)制
定的JPEG和MPEG。JPEG是静止图像的压缩标准, 其
压缩比可达 40∶1 。 MPEG ( MPEG-1 、 MPEG-2 及 MPEG-4 )是动态图像的压缩标准 , 采用 MPEG-2标准 对NTSC质量视频进行压缩后 , 网络带宽需求可降低到 3.36 Mb/s。 其它的标准还有国际电信联合会(ITU) 制定的用于可视电话、 会议电视的 H.261和H.263; 用 于音频的G.711、 G.721、 G.728等。
3.2数据压缩的理论依据
离散信源X:信息源所产生的符号取自某一离散集合。
每个符号的信息量I:指符号si出现的概率,I是随机变量;
熵(H):各个符号信息量 I 的统计平均,是从统计平均的 角度反映信源的一个总体特征
•符号出现之前,熵表示符号出现的平均不肯定性; •符号出现之后,熵表示接收一个符号所得到的平均信息量; •各符号出现的概率分布不同,信源的熵也不同; 最大离散熵定理 当信源符号出现的概率相等时,信源具有最大熵,每个 符号携带的平均信息量最大。 •最大离散熵定理,在熵编码时,可以确保每个符号携带 最大的信息量。
式3-47、3-48、3-49,进行块匹配计算。
帧内编码
帧间 预测编码
③ 如果找到这样的匹配块, 则进行下列计算:
·当前块的块亮度值与参照帧中对应块(称参照块)的块亮
度值之间的差值信号; (背景差) ·当前块相对于参照块在x和y两个方向上的运动向量值, 表 示该块在x和y方向上的平移。 通过定义一个搜索域来限制x和y 方向上的搜索范围, 以降低运动信息的开销; (运动估值)
基函数
2 s( j, k ) N
(2 j 1)u (2k 1)v C (u )C (v) S (u , v) cos cos 2N 2N u 0 v 0
N 1 N 1
式中:
1 C (u ) 2 C (v ) 1
u,v=0
其它
注意:对于u v 0时,两个余弦项均为零,这时对应的 DCT 系数代表直流分量;
第3章 数据压缩的基本技术
3.1 概述
3.2数据压缩的理论依据
3.5预测编码 3.6正交变换编码 3.9量化 3.10熵编码
3.1 概述
数据压缩处理一般由两个过程组成: 一是编码过程, 即对原始数据进行编码压缩, 以便存储和传输; 二是解 码过程, 即对压缩的数据进行解压 , 恢复成可用的数据。 根据解压后数据的保真度, 数据压缩技术可分为无损压 缩编码和有损压缩编码两大类。 无损压缩编码是指 解码后的数据与原始数据完全相同, 无任何偏差。这种 编码通常基于信息熵原理, 常用的编码有哈夫曼编码、 算术编码、 行程编码等。它的压缩比通常比较低, 一般 在 2∶1 ~ 5∶1 。主要用于要求数据无损压缩存储和传 输的场合, 如传真机、文本文件传输等。
相关主题