当前位置:
文档之家› 第3讲_信息表示与编码(声音、图像、视频)详解
第3讲_信息表示与编码(声音、图像、视频)详解
则在0-0.5之间的所有数值均用0表示,0.51之间的数值均用0.5表示,1-1.5之间的数值均用 1表示,…,3.5-4之间的数值用3.5表示。
可见量化的作用是使幅值数字化,即把无限 个数值用有限个数来表示。
量化不可避免的存在偏差。如果分成16个量化 区间(量化等级为16),每份为0.25.
则0-0.25之间的数值用0表示,0.25-0.5之间 的数值用0.25表示,…,3.75-4之间的数值用3.75 表示,这时的偏差比分成8个区间要小。
可以实现1∶10甚至1∶12的压缩率。
例如:将“录音机”产生的.wav文件另存为.mp3
格式
14/45
数据存储——存储图像
位图
矢量图
15/45
数据存储——存储图像
44.1k×16×2×60÷8=10584000B≈10.09MB
10/45
数据存储——存储音频
•不同质量声音的性能指标
质量
电话 AM FM CD DAT
采样频率 (kHz)
8 11.025 22.050
44.1 48
样本精度 (b/s)
8 8 16 16 16
声道
单声道 单声道 立体声 立体声 立体声
100MB左右。
13/45
数据存储——存储音频
•声音文件(编码标准)——MPEG音频文件(.mp3)
MP3是一种音频压缩技术标准,其全称是动态影像专 家组音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。
利用人耳对高频信号无法识别的原理,将时域波形信 号转换成频域信号,并划分成多个频段,对不同的频段使用 不同的压缩率,对高频加大压缩比(甚至忽略信号)对低频 信号使用小压缩比,保证信号不失真。
位率:单位时间内产生的音频数据位数。 量化位数为B,采样率为S,则位率为S×B(存储 每秒音频需要的位数)
8/45
数据存储——存储音频
•对比不同的采样、量化、编码
采样频率11KHz 8位量化
采样频率22KHz 16位量化
9/45
数据存储——存储音频
•数字化音频的数据量
采样是对模拟信号在时间轴上进行数字化,而量化是 对模拟信号在幅度上的数字化,编码则是将量化后得到的数 据表示成二进制数据,
7/45
数据存储——存储音频
•编码(采样值如何表示)
是指将量化后的样本值按照对应的量化等级, 用若干二进制位(也叫量化位数)表示的过程。
对于幅值为0-4,若量化等级为8,可用3位 的二进制数来表示样本值的大小,如用000表示0, 001表示0.5,010表示1,…,111表示3.5。
同理,若量化等级为16,则用4位的二进制数 来表示样本值的大小。
数据率 (kb/s)
64.0 88.2 705.6 1411.2 1536.0
频率范围 (Hz) 200~3400 50~7000 20~15000 20~20000 20~20000
Digital Audio Tape 数字录音带
样本位数越多,声音质量越高,而需要的存储空间也越大
11/45
数据存储——存储音频
(双声道),通常文件较大,多用于存储简短的声
音片段(Windows XP系统自带一些Wave格式的
声音文件,在C:\WINDOWS\Media文件夹储音频
•声音文件(编码标准)——MIDI格式文件(.mid)
MIDI是乐器数字接口 (Musical Instrument Digital Interface)的英文缩写,是声卡提 供的一个接口,用于将电子乐器与计 算机相连。
数据量(B)=采样频率×量化位数×采样时间×声道数÷8
例:人正常说话时的声音频率一般在20Hz~4kHz。采样 频率为8kHz,量化位数为8bit,求1秒的声音数字化后的 数据量。8k×8÷8=8000(B)≈7.8KB
如果是高质量的CD音质效果,采样频率为44.1kHz, 量化位数为16bit,双声道立体声,则1分钟的数据量为:
第三讲 信息编码
(声音、图像、视频)
第三讲 信息表示与编码 内容提要
数据存储
–声音 –图像 –视频
2/45
数据存储——存储音频
•模拟信号与数字信号
模拟信号: 时间和幅度都是连续的信号 数字信号: 时间和幅度都是离散的信号 音频是一种随时间连续变化的模拟数据.
3/45
数据存储——存储音频
•模拟信号如何存储?
•声音文件(编码标准)——Wave格式文件(.wav)
Wave文件的形成是用麦克风录音后,经计算 机的声卡完成数字化过程形成扩展名为.wav的声音 文件,存储在计算机的硬盘中。
例如:“附件”中“录音机”产生
的播.w放av时文由件声卡还原成模拟信号经扬声器输出。
Wave格式文件采样频率44.1khz,16位,立体声
当乐器弹奏时,声卡记录下乐器的音调、声音 的强弱、使用的何种乐器等信息,这些信息形成一连
串的二进制数字,从而形成MIDI文件。
播放MIDI格式的声音时,声卡根据数字代表的含义进行
声音合成后由扬声器输出。可见,MIDI文件存放的不是声音的
采样信息,相对于Wave文件,MIDI文件要小得多。同样10分
钟的立体声音乐,MIDI文件大小不到70KB,而声音文件要
数据存储——存储音频
•量化(离散化幅度) 将幅值在最大值和最小值之间划分N个区间,
一般采用等分方式。
幅度
时间
如上图所示的量化过程采用了8个量化区间 (也称量化等级为8),把位于一个量化区间内的采 样点的值归为一类,即赋予相同的量化值。
6/45
数据存储——存储音频
例如:假设声音的幅度值范围是0-4,将0-4 之间的幅值分成了8等份,每份为0.5.
➢ 一段时间内,拥有无限数量的观测值,不可 能完全存储在计算机中。
➢利用采样量化编码的策略,存储离散 时间点上的音频信号强度。
4/45
数据存储——存储音频
•采样(离散化时间)
在模拟信号上选择数量有限的点来度量他们的值并 记录下来,通过记录的值来表现模拟信号。
采样率:每秒钟采样的次数;采样率越高,则占用更 多的存储空间,效果越好;对于音频信号,每秒采样40000 次的效果已经足够好。 奈奎斯特理论(采样定理): 采样频率不低于声音信号最高 频率的两倍,即可将以数字表达的声音还原成原来的声音。5/45