当前位置:文档之家› 图像编码基础.

图像编码基础.


基本概念
图像编码:为表达图像数据需要使用一系列的符号(如字 母、数字等),用这些符号根据一定的规则来表达图像就 是对图像编码。 码本:编码所用符号的集合称为码本。 如二元码本0、1 码字:对每个信息或事件所赋的符号序列称为码字。 码字长度:每个码字里的符号个数称为码字长度。 自然码:m bit的二元码中的一个。 不论灰度级的大小, 赋予相同的码字长度。
lim [ L'avg ] H (u) n n
香农第二定理(有失真编码定理):
在给定保真度准则的前提下,如何来确定最小的编码 所用数据率(每像素的平均比特数)? 如果允许最大可能的失真,就可获得最小的信息率。
通俗的说,允许的失真度越大,图像的压缩率就越高。
6.4 哈夫曼编码
变长编码是基于统计模型的,也有人称熵编码, 可以减少图像的编码冗余。
3. 心理视觉冗余
心理视觉冗余产生是由于眼睛并不是对所有视觉信息 有相同的敏感度。有些信息在通常的视感觉过程中与另外 一些信息相比来说不那么重要,这些信息可以认为有心理 视觉冗余,去除这些信息不会明显的降低所感受到的图像 质量。 如何消除心理视觉冗余呢?
通过“改进灰度级量化”过程消除心理视觉冗余, 量化的结果导致数据的有损压缩。
或近似相等,然后重复第二步骤赋值。直到每个子集里只
包含一个消息为止。
例 求下述信源的香农-费诺编码
X u01.1
u2 0.4
u3 0.06
u4 0.1
u5 0.04
u06.3
符号 概率 1 2 3 4 5 码字
u2
0.4 0
0
u6
0.3
0
10
u1
0.1
0
u4
0.1 1 1
0
110 1110
从大到小排列一次。

X1

uP11
' '
, ,
u2 P2
' '
,, ,,
uM PM
1 1
' '
第三步,重复上述步骤,直到信源最后为X0为止
X 0 uP1100
u
0 2
P20

第四步,将被合并的消息分别赋以1和0或0和1。对最后的
X0也即对
u10
和u
0 2
u3
0.06
1 1 0 11110
u5
0.04
1 11111
练习
1. 求下述信源的哈夫曼编码,以及熵、平均码长、效率和 冗余度。
X

u1 0.25
u2 0.25
u3 0.20
u4
u5
0.15 0.10
0u.06 5
2. 求下述信源的香农-法诺编码,以及熵、平均码长、效 率和冗余度。
[ fˆ (x, y)
x0 y0
f


(
x,
y)
]2


其中,fmax max{ f (x, y), x 0,1,2,, M 1, y 0,1,2,, N 1}
2. 主观保真度准则
常用方法是对一组精心挑选的观察者展示以傅典型的 图像并将它们对该图的评价综合平均起来以得到一个统计 的质量评价结果。
X



u1 0.25
u2 0.25
u3 0.125
u4 0.125
u5 0.0625
u06.0625
6.5 算术编码
说明:L是灰度级数,nk是第k个灰度级在图像中出现的次 数,n是图像中的像素总数。随即变量rk∈[0,1]表示图
像的灰度级。
设用来表示sk的每个数值的比特数是l(rk),那么为表示 每个像素所需的平均比特数(平均码字长度)是:
l 1
Lavg l(rk ) pr (rk ) k 0
自然码是每个随机事件用来自m比特二进制技术序列的 2m个m比特二进制码的其中一个来表示,是等长码。当一
u3 0.06 0 0.1 1
u5 0.04 1
0.4 0.3 0 0.3 1
0.6 0 0.4 1
6.4.2 变长码的特性
变长码都是基于统计模型的,哈夫曼编码和香农-法诺编码都是所谓 的块码,因为它们都将每个信源符号映射成一组固定次序的码符号, 这样在编码时可以一次编一个符号。
从解码的角度:人们常关注两个特性:即时性和唯一性。
(1)即时性(也称非续长性) 任意一个码字都不是其它码字的续长。
(2)唯一性(单义性) 任意一个有限长的码字序列只能被分割成一个一个的码字,而
任何其他分割方法都会产生一些不属于码字集合中的码字。符合这 个条件的代码叫单义代码。
非续长代码一定是单义的,单义代码却不一定是非续长代码。
6.4.3 亚最优变长码
表8.3 电视图像的等级量表
值 等级


1 极好
具有极高品质的图像,和希望的一样好
2

高品质的图像,感觉良好,其中的干扰可以接受
3
过得去 具有可接受的品质。其中的干扰不是不可以接受
4
勉强可以 品质不良的图像;希望能得到改进。干扰在某种程度上难于接受
5

非常不好的图像,但还可以看。有明显不能接受的干扰
6
不可用
差到无法观看的图像
6.3 无失真编码定理
信息论简介 信息论是研究编解码的基础。 有关图像压缩的基本问题: I. 什么是图像压缩的极限?(熵) II. 什么是图像传输率的最终极限?(信道容量)
基本概念: 熵
H(X ) P(x)log2 P(x)
自信息
I (E) log P(E)
数据冗余与信息
表达无用信息的数据就叫数据冗余。 数据冗余可用数学定量的描述。设n1和n2分别代表用来 表达相同信息的两个数据集合中的信息载体单位的个数, 那么第一个数据集合(相对于第二个数据集合)的相对 数据冗余RD定义为:
RD
1
1 CR
其中CR为压缩率:CR n1 / n2
CR和RD分别在开区间( 0,)和( ,1)
ai进行编码。一般情况下取二元字母集 A{0,1} 根据信息 论中熵的定义,可算出该信源的熵为:
M
H ( X ) Pi log 2 Pi i 1
平均码长:
设对应于每个消息的码字由Ni个符号组成,也就是说每 个消息对应的码字长M度各为Ni。
N Pi Ni i 1
编码效率:
H(X)
数据冗余的分类
在数字图像压缩中,可以确定三种基本的数据冗余:
编码冗余、像素间冗余、心理视觉冗余。当这三种冗余的 一种或多种得到了减少或消除时,就实现了数据压缩。
1. 编码冗余
利用图像的灰度级直方图来深入了解编码结构,从 而减少表达图像所需的数据量。
pr(rk) nk n
k 0,1,2,, L 1
根据哈夫曼方法的原理,当需要对大量符号进行编码 时,构造最优哈夫曼码的计算量会很大,此时常采用一些 亚最优的变长编码方法。下面仅介绍两种基于哈夫曼方法 的截断哈夫曼码和平移哈夫曼码。
1.截断哈夫曼码
截断哈夫曼码是对哈夫曼码的一种改型。只对最可能 出现的M个符号进行哈夫曼编码,而对其它的码都用在一 个合适的定长码前加一个前缀码来表示。
图像压缩所解决的问题是尽量减少表示数字图像时 需要的数据量,减少数据量的基本原理是除去其中多余 的数据。以数学观点来看,实际上就是将二维像素阵列 变换为一个在统计上无关联的数据集合。
图像压缩方法分类: 信息保存型和信息损失型。
6.1 数据冗余和压缩
图像编解码过程
原始图像 编码
存储
编码结果
解码
传输
解码图像
第一步,设信源X有非递增的概率分布;
X

u1, u2 , u3 ,, uM P1, P2 , P3 ,, PM

其中,P1 P2 PM 把X分成两个集合,得:
X1

u1, u2 , u3 ,, uk P1, P2 , P3 ,, Pk

X2

uk Pk
常用的有两大类:客观保真度准则和主观保真度准则。
1. 客观保真度准则
1) 均方根误差
erms
ห้องสมุดไป่ตู้
[ 1 MN
M 1 N 1
[ fˆ (x, y)
x0 y0
f (x, y)]2 ]1/ 2
2) 均方信噪比
M 1 N 1
M 1 N 1
SNRms [ fˆ(x, y)]2 [ fˆ(x, y) f (x, y)]2
幅图像的灰度级直接用自然二进制编码来表示时,冗余总 是存在的。 如何消除编码冗余呢? 采用变长编码,比如哈夫曼编码,香农编码等。
2. 像素间冗余 像素间冗余也称空间冗余或几何冗余,来自图像中
对象之间的结构或几何关系。
如何消除像素间冗余呢? 利用相邻像素间的差异描绘图像,这种变化被认为是
映射。比如行程编码。
基本概念
熵:
设某个无记忆信源共有M个消息,记作{u1,u2,,uM }。其
中消息ui (i 1,2,, M ) ,各自出现的概率分别为:{P1, P2 ,, PM }
可把这个信源用下式表示: X

uP11
, ,
u2 P2
,, ,,
uM PM

根据该信源的消息集合,在字母集 A {a1, a2 ,, an} 中选取
x0 y0
x0 y0
3) 均方根信噪比
M 1 N 1
M 1 N 1
SNRrms
[ fˆ(x, y)]2
[ fˆ(x, y) f (x, y)]2
相关主题