多媒体技术基础无损压缩
x(t)
2 M称为奈奎斯特率 ; M称为奈奎斯特频率。
2
数据压缩
压缩的必要性
❖音频、视频的数据量很大,如果不进行处 理,计算机系统几乎无法对它进行存取和 交换。
例如:一幅中等分辨率(640×480)的真彩 色图像(24b/像素),它的数据量约为0.9MB/ 帧,若要达到每秒25帧的全动态显示要求,每秒 所需的数据量约为22MB。对于声音也是如此, CD音质的声音每秒将有约为172KB的数据量。
信息论
❖1948年 C.E.Shannon 香农 发表了题为 “通信的数学理论”的论文。
❖ 运用通信技术与概率论、随机过程、数理统计的 方法系统讨论了通信的基本问题,得出了几个重 要而带有普遍意义的结论:
1.阐明通信系统传递的对象就是信息 2.对信息给予科学的定量描述 3.提出了信息熵的概念
压缩理论
为20Hz到 4kHz,即语音的带宽为4kHz,若设量化位数为
8bit,则一秒钟 的数据量为:
4×2×8=64kbit/s= 8KB/s 则一分钟的数据是480KB。
360B 480KB
数据冗余的类别
▪ 空间冗余 ▪ 时间冗余 ▪ 统计冗余 ▪ 信息熵冗余 ▪ 结构冗余 ▪ 知识冗余 ▪ 视觉冗余 ▪ 听觉冗余
信息论科学体系
香农信息论
传输理论
保密理论
有失真信源编码 无失真信源编码
率失真理论
等长编码 变长编码
定理
定理
有噪声 信道编码理论
网络信道
保密系统的 信息理论
网络信息理论
压缩编码
最优码构成 Huffman码
Fano码
码构成 纠错码
网络最佳码
保密码
代数编码 卷积码
信息论之父
❖ The Father of Information Theory—— Claude Elwood Shannon ▪ Born: 30 April 1916 in Gaylord, Michigan, USA ▪ Died: 24 Feb 2001 in Medford, Massachusetts, USA
模数转换-采样
❖概念:
从连续时间信号中提取离散样本的过程;或者 说在某些离散的时间点上提取连续时间信号值的 过程称为采样。
❖ 采样按采样间隔可分为:均匀采样与非均匀采样。
采样的必要性
❖采样是连续时间信号和离散时间信号之间 的桥梁,对连续信号而言,随着数字处理 技术的发展,越来越迫切地要求连续信号 的离散化。
例如,电影的连续画面,实际上是由一组时间样本快 速播放实现的,数字通信系统,微处理器系统对连续 时间信号的处理,都是通过采样来实现的。
采样示例
采样
当取出的样本一样时,样本对应的连续时间 函数却不是唯一的。
采样
❖此外,对同一个连续时间信号,当采样间 隔不同时也会得到不同的样本序列。
结论:没有任何条件限制的情况下,从连续时间信号 采样所得到的样本序列,不能唯一地确定原来的连续 时间信号,即:一个连续时间信号必须在某一种条件 下才能由其样本来表示。
数据冗余的类别
●空间冗余 规则物体和规则背景的表面物理特性都具有相关性, 数字化后表现为数据冗余。
●时间冗余
序列图像(如电视图像和运动图像)和语音数据的前 后有着很强的相关性,经常包含着冗余。在播出该序 列图像时,时间发生了推移,但若干幅画面的同一部 位没有变化,变化的只是其中某些地方,这就形成了 时间冗余。
多媒体技术基础无损压缩
路漫漫其悠远
少壮不努力,老大徒悲伤
1
数字化原理
模拟信号
❖模拟信号指幅度的取值是连续的(幅值可 由无限个数值表示)。
❖现实中涉及的许多媒体对象是模拟信号 例如:声音、图像、视频等
数字信号
❖数字信号是人为抽象出来的在时间上的不 连续信号,是离散时间信号的数字化表示, 通常由模拟信号获得。
熵
❖定义:
▪ 设随机变量X,取值空间Ω,Ω为有限集合。X
的分布密度为p(x),p(x)=P(X=x) x∈X,则该
随机变量的取值不确定程度,即其熵为:
H (X ) H (p ) p (x )lo gp (x ) a llp o ssib lev a lu e s x D e fin e0 lo g 0 0 ,lo g lo g 2
采样分析
采样函数: p(t) (t nT) n 采样样本:
xp(t)x(t)p(t)Leabharlann x(t) (t nT) n
x(nT)(t nT)
n
采样分析
原连续时间信号:x(t)X(j)
采样函数频谱:
P(j)2(k2)
Tk
T
已采样信号的频谱:
XP(j)2 1 X(j)P(j)
1 T
X(j(ks)
数据冗余的类别
●统计冗余 空间冗余和时间冗余是把图像信号看作概率信号时反应 出的统计特性,因此,这两种冗余也被称为统计冗余。 ●信息熵冗余 信息熵实际情况又称编码冗余。信息熵是指一组数所 携带的信息量。
k
s M M s M M
采样分析
对连续时间信号在时域理想采样,就相当 于在频域以采样频率s为周期延拓,幅值减小 1/T。要使频谱不混迭,就必须使信号带限, 且
s M M s 2M
上述即为时域采样的约束条件
从而我们得到怎样抽取样本,样本才能唯一地表征原信 号的取样条件,下面为上述分析的一个完整总结--采样 定理。
❖计算机处理的对象是数字信号(二进制数 “0” 和 “1” )
例如:英文字符以的 ASCII 代码,汉字字符的国 标 GB2312-80 代码表示都是二进制数字串
多媒体系统的数模与模数转换
传感器
(声音、图像、视 频等--模拟)
A/D
输出设备
(数字)
输出设备
(声音、电视-等模拟)
计算机
(数字)
D/A
▪ 当使用log2时,熵的单位为比特 ▪ 反映一个信源发出不同信号,具有的平均信息量。
熵
为什么能够进行压缩
信息论认为:若信源编码的熵大于信源的 实际熵,该信源中一定存在冗余度(信息 熵冗余)。
冗余的基本概念
❖ 指信息存在的各种性质的多余度
举例: (1)广播员读文稿时每分钟约读180字,一个汉
字占两个 字节;文本数据量为360B; (2)如果对语音录音,由于人说话的音频范围
采样定理
设 是x(某t) 一个带限信号,在||> M时,X
(j)=0。如果采样频率 s>2 M ,其中 s =
2/T, 那么 就唯一x地(t由) 其样本 所确定。x(nT)
已知这些样本值,我们能用如下办法重建:让 采样后的信号通过一个增益为T, 截止频率大于M, 而小于( s M)的理想滤波器,该滤波器的输 出就是 。