图像压缩基本原理
• 内容: 1、 JPEG标准的主要内容 2、 JPEG静态图像压缩算法
1.JPEG标准的主要内容
• JPEG 是 Joint Photograph Experts Group 的缩写,这是一个在1986年CCITT和 ISO联合成立的一个图像专家组。 • JPEG标准即多灰度连续色调静态图像压缩 编码,这是一个适用于彩色和单色多灰度 或连续色调静止数字图像的压缩标准。
基本原理图
子块 1 子块 2
正变换
滤波
量化
编 码
...
子块 n
源图像(发送)
信道
解 码
逆变换
综合 拼接
...
恢复图像(接收)
主要的变换编码方法
• 卡亨南—洛维变换(KLT) 离散余弦变换(DCT) 沃尔什—哈达玛变换(WHT) 离散傅里叶变换(DFT)
离散余弦变换(DCT变换)
• DCT变换使用下式计算
DPCM基本原理
转入 f(i,j) f(i,j) f’(i,j) 预测器 e(i,j) 量化器 编码器 信 道 传
f’(i,j)
f’(i,j) 输出 预测器
输
e’(i,j)
解码器
f(i,j)
变化编码
• 变化编码是有失真编码的一种重要的编码类型。 在变化编码中,原始数据从初始空间或者时间域 进行数学变换,使得信号中最重要的部分(例如 包含最大能量的最重要的系数)在变换域中易于 识别,并且集中出现,可以重点处理;相反使能 量较少的部分较分散,可以进行粗处理。例如将 时域信号变换到频域,因为声音、图象大部分信 息都是低频信号,在频域中比较集中,再进行采 样编码可以压缩数据。该变换过程是逆过程,使 用反变换可以恢复原始数据。
预测编码
• 预测编码是根据原始的离散信号之间存在着一定关联性的 特点。利用前面的一个或多个信号对下一个信号进行预测, 然后将实际值和预测值的差(预测误差)进行编码。如果 预测比较准确,那么误差信号就会很小。这样一来,在同 等精度要求的条件下,就可以用比较少的数码进行编码, 达到数据压缩的目的。 • 两种典型的预测编码是DPCM和ADPCM,他们比较适合 于声音、图象数据的压缩。因为这些数据均由采样得到, 相邻样值之间不会相差很大,可以用较少的位来表示差值。 由于在对差值编码时进行了量化,因此预测编码是一种有 失真编码方法。
JPEG压缩算法具有如下特点:
1)参数化解码器,可大范围调节压缩/质量比; 2)适应于任何连续色调图像; 3)硬件要求低; 4)有四种工作模式: a.基于DPCM的无失真算法 b.顺序编码 c.累进编码 d.分层编码
JPEG静态图像压缩算法
• 1.基于DPCM无失真压缩算法 • 2.基于DCT的有失真压缩编码
• 在JPEG有损压缩算法中,使用霍夫曼编码器 来减少熵。使用霍夫曼编码器的理由是可以使用 很简单的查表(lookup table)方法进行编码。压 缩数据符号时,霍夫曼编码器对出现频度比较高 的符号分配比较短的代码,而对出现频度较低的 符号分配比较长的代码。这种可变长度的霍夫曼 码表可以事先进行定义。
2 MPEG-1 标准
• MPEG-1即“用于数字存储媒体运动图像及 其伴音速率为1.5Mbps的压缩编码”。 • MPEG-1的任务主要是,将视频信号及其伴 音以可接收的重建质量压缩到约1.5Mbps的 码率,并复合成一个单一的MPEG位流,同 时保证视频和音频的同步。
MPEG-1标准分4个部分
DCT变换使用下式计算
逆变换使用下式计算
基于DCT编码的关键步骤——第三步
量
化
对于有损压缩算法,JPEG算 法使用如图所示的均匀量化 器进行量化,量化步距是按 照系数所在的位置和每种颜 色分量的色调值来确定。
量化表
因为人眼对亮度信号比对色差信号更敏感,因此使用了两 种量化表:亮度量化值和色差量化值。此外,由于人眼对 低频分量的图像比对高频分量的图像更敏感,因此图中的 左上角的量化步距要比右下角的量化步距小。
图像压缩算法
2006-08-22
图像压缩算法
• 数据压缩基本知识
• 图像压缩算法
数据压缩基本知识
• 数据压缩的分类 • 根据压缩和解码后原始数据信息是否有丢 失,压缩方法可被分为有失真编码和无失 真编码两大类,在此基础上根据编码原理 进行分类,大致有:预测编码就、变换编 码、统计编码、分析——合成编码、混合 编码和其他一些编码方法
基于DCT编码的关键步骤——第四 步
基于DCT编码的关键步骤——第五 步
–熵编码可分成两步进行,先把DC码和行 程码转换为中间符号序列,然后给这些 符号赋以变长码字。 – JPEG建议的熵编码是Huffman编码和自 适应二进制算术编码。
• 使用熵编码还可以对DPCM编码后的直流DC系数和 RLE编码后的交流AC系数作进一步的压缩。
数据压缩基本知识
数据压缩基本知识
• • • • • 统计编码 预测编码 变换编码 分析——合成编码 混合编码
统计编码
• 统计编码包括行程编码、LZW编码、huffman编码等,属于无失真编 码。它是根据信息出现的概率的分布特性而进行的压缩编码。其方法 是:识别一个给定的数据流中出现概率最高的比特或字节模式,并用 比原始比特更少的比特数来对其进行编码:也就是说,出现的概率越 低的模式,其编码的位数就越多,出现概率越高的模式编码的位数就 越少。如果码流中所有模式出现的概率相等,则平均信息量就越大, 信源没有冗余。这种编码的宗旨在于,在消息和码字之间找到明确的 一一对应关系,以便在恢复时能准确无误地再现出来,并总是要使平 均码长或码率压低到最低限度。 • 行程编码 • • LZW编码 Huffman编码
①MPEG系统:定义音频、视频及有关数据的同步; ②MPEG视频:定义视频数据的编码和重建图像所 需的解码过程,亮度信号分辨率为360×240, 色度信号分辨率为180×120; ③MPEG音频:定义音频数据的编码和解码; ④一致性测试。
• MPEG-1标准没有规定编码器和解码器的体系结构 或实现方法,但提出了功能和性能上的要求。 • 此外,MPEG算法编码过程和解码过程是一种非镜 像对称算法,也就是说运动图像的压缩编码过程 与还原解码过程是不对称算法,解码过程要比编 码过程相对简单。实际上,MPEG-1和MPEG-2只规 定了解码的方案,重点将解码算法标准化。因而 用硬件实现MPEG算法时,人们首先实现MPEG的解 码器,如C—Cube公司CL450解码器系列。
Huffman编码
• 最佳编码定理:在变字长码中,对于出现 概率大的信息符号编以短字长的码,对于 出现概率小的信息符号编以长字长的码, 如果码字长度严格按照符号概率的大小的 相反顺序排列,则平均码字长度一定小于 按任何其他符号顺序排列方式得到的码字 长度。
Huffman编码
• Huffman编码就是利用这个定理,把信源符 号按概率大小顺序排列,并设法按逆次序 分配码字长度。
2.基于DCT的有失真压缩编码
• 基于DCT压缩编码算法包括两种不同的系统, 即基本系统和增强系统。增强系统是基本 系统的扩充。 • 基于DCT编码其压缩比:10:1~100:1。 • 在压缩比小于40:1的情况下,压缩后还原 得到的图象与原始图象相比较,主观效果 几乎一样,因此得到了广泛的应用。
• MPEG标准是面向运动图像压缩的一个系列 标准。 • 最初MPEG专家组的工作项目是3个,即在 1.5Mbps,l0Mbps,40Mbps传输速率下对图 像编码,分别命名为MPEG-1,MPEG-2, MPEG-3。l992年,MPEG-2适用范围扩大到 HDTV,能支持MPEG-3的所有功能,因而 MFEG-3被取消。
MPEG音频
• MPEG音频压缩算法是第一个高保真音频数 据压缩国际标准,它同时可完全独立应用。
MPEG音频标准具有如下特点:
(1)音频信号采样率可以是32kHz,44.1kHz或 48kHz; (2)压缩后的比特流可以按4种模式之一支持单 声道或双声道; (3)压缩后的比特流具有预定义的比特率之一; (4)MPEG音频标准提供3个独立的压缩层次; (5)编码后的比特流支持循环冗余校验CRC; (6)MPEG音频标准支持在比特流中载带附加信息
What is wavelet
• 一种函数
– 具有有限的持续时间、突变的频率和振幅 – 波形可以是不规则的,也可以是不对称的 – 在整个时间范围里的幅度平均值为零 – 比较正弦波
部分小波波形
• 小波的定义:
子带编码
• 把信号的频率分成几个子带,然后对每个子带分 别进行编码,并根据每个子带的重要性分配不同 的位数来表示数据 • 20世纪70年代,子带编码开始用在语音编码上 • 20世纪80年代中期开始在图像编码中使用 • 1986年Woods, J. W.等人曾经使用一维正交镜像 滤波器组(quadrature mirror filterbanks,QMF)把 信号的频带分解成4个相等的子带
基于DCT编码的关键步骤——第一步
• 分割子块 • 把原始图像顺序分割成8×8子块; • 子块:8 × 8 象元, • 特点:象元间变化平缓,相关性高
基于DCT编码的关键步骤——第二步
正向离散余弦变换
• 对每个单独的彩色图像分量,把整个分量图像分成8×8
的图像块,如图所示,并作为两维离散余弦变换DCT的输 入。通过DCT变换,把能量集中在少数几个系数上。
混合编码
• 混合编码 • 合并变换和预测技术的编码方法。 • 在某一方向上进行酉变换,而在另一方向 上采用DPCM对变换系数进行预测编码。 • 对动态图像而言,采用二维变换加上时间 方向上的DPCM预测
2.图像压缩算法
• 静态图像压缩算法(JPEG)
• 动态图像压缩算法(MPEG)
静ห้องสมุดไป่ตู้图像压缩标准JPEG
Example
Example