当前位置:文档之家› 第3讲_信息表示与编码(声音、图像、视频)

第3讲_信息表示与编码(声音、图像、视频)

10/45
数据存储——存储音频
•不同质量声音的性能指标
质量
电话 AM FM CD DAT
采样频率 (kHz)
8 11.025 22.050 44.1 48
样本精度 (b/s)
8 8 16 16 16
声道
单声道 单声道 立体声 立体声 立体声
数据率 (kb/s)
64.0 88.2 705.6 1411.2 1536.0
数据存储——存储图像
•矢量图文件优点 ①由于矢量图形的特点,通过软件可方便地将矢量图 进行缩放、移动、旋转等,其尺寸可以任意变化而不 会损坏图形的质量。 ②由于矢量图形只保存算法和特征点参数,因此占用 的存储空间较小。 •矢量图文件缺点 ①当图形复杂时,计算时间较长。 ②对于某些复杂的彩色照片(如真实世界的照片)很 难用数学公式来描述图形的构造,而采用位图来表示。
20/45
数据存储——存储图像
•色彩的三原色
原文为:Commission Internationale de L‘Eclairage(法);或International Commission on illumination(英)
1)国际照明委员会(CIE) 规 定以700nm(红)、 546.1nm(绿)、435.8nm (蓝) 三个色光为三基色。又称为 物理三基色。 2)自然界的所有颜色都可以 通过这三基色按不同比例混 合而成。
17/45
数据存储——存储图像
•存储空间(矢量图) 例:一幅由1000条直线组成的矢量图形,计算存储空间。
矢量图存储的是构造图形的线条信息,每条 线的信息可由起点坐标(x1,y1)、终点坐标(x2, y2)、线条颜色、线条宽度、线条类型(虚线、实 线等)等属性表示。
其中4个坐标点每个用2个字节存储,其它5个属 性用1个字节存储,则存储这幅图形的存储空间为: [4(坐标点)×2(字节)+5(属性)×1(字节)] ×1000(条)=12.7KB
例:人正常说话时的声音频率一般在20Hz~4kHz。采样频 率为8kHz,量化位数为8bit,求1秒的声音数字化后的数据 量。 8k×8÷8=8000(B)≈7.8KB
如果是高质量的CD音质效果,采样频率为44.1kHz, 量化位数为16bit,双声道立体声,则1分钟的数据量为: 44.1k×16×2×60÷8=10584000B≈10.09MB
640×480×24÷8=921600B=900KB
矢量图所需的存储空间要比位图小得多。
29/45
数据存储——存储图像
•位图文件优点 ①可以表现出色彩丰富的图象效果 可逼真表现自然界各类景物 •位图文件缺点
①文件占用存储空间大; 放大图像会出现失真(马赛克,mosaic)。
频率范围 (Hz)
200~3400 50~7000 20~15000 20~20000 20~20000
Digital Audio Tape 数字录音带
样本位数越多,声音质量越高,而需要的存储空间也越大
11/45
数据存储——存储音频
•声音文件(编码标准)——Wave格式文件(.wav) Wave文件的形成是用麦克风录音后,经计算 机的声卡完成数字化过程形成扩展名为.wav的声音 文件,存储在计算机的硬盘中。 例如:“附件”中“录音机”产生的.wav 文件 播放时由声卡还原成模拟信号经扬声器输出。 Wave格式文件采样频率44.1khz,16位,立体声(双 声道),通常文件较大,多用于存储简短的声音片 段(Windows XP系统自带一些Wave格式的声音文件, 在C:\WINDOWS\Media文件夹中有)。
一段时间内,拥有无限数量的观测值,不可 能完全存储在计算机中。 利用采样量化编码的策略,存储离散 时间点上的音频信号强度。
4/45
数据存储——存储音频
•采样(离散化时间)
在模拟信号上选择数量有限的点来度量他们的值并 记录下来,通过记录的值来表现模拟信号。
采样率:每秒钟采样的次数;采样率越高,则占用更 多的存储空间,效果越好;对于音频信号,每秒采样40000 次的效果已经足够好。
12/45
数据存储——存储音频
•声音文件(编码标准)——MIDI格式文件(.mid)
MIDI是乐器数字接口 (Musical Instrument Digital Interface)的英文缩写,是声卡提 供的一个接口,用于将电子乐器与计 算机相连。
当乐器弹奏时,声卡记录下乐器的音调、声音 的强弱、使用ቤተ መጻሕፍቲ ባይዱ何种乐器等信息,这些信息形成一连 串的二进制数字,从而形成MIDI文件。 播放MIDI格式的声音时,声卡根据数字代表的含义进行声 音合成后由扬声器输出。可见,MIDI文件存放的不是声音的采样 信息,相对于Wave文件,MIDI文件要小得多。同样10分钟的立体 声音乐,MIDI文件大小不到70KB,而声音文件要100MB左右。
例如:将“录音机”产生的.wav文件另存为.mp3格 14/45 式
数据存储——存储图像
位图
矢量图
15/45
数据存储——存储图像
位图
矢量图
一般把位图称为图像,把矢量图称为图形。 图形与图像在计算机上的显示结果基本相似,但 实现方法完全不同。
16/45
数据存储——存储图像
•矢量图
用一组指令集合来描述图形的内容,这些描 述包括图形的形状、位置、大小、色彩等特征。 例如:点(x1,y1)到点(x2,y2)的一条直 线可以用Line(x1,y1,x2,y2)表示。 Circle(x,y,r)表示圆心位置为(x,y), 半径为r的一个圆。
彩 色 编 码
27/45
数据存储——存储图像
根据色彩形成原理,不同取值的R、G、B可表示 256×256×256=224(约1677万)种色彩。 特殊情况:如果R=0,G=0,B=0表示黑色;如果R=255, G=255,B=255表示白色 量化位数称为色彩深度。24位深度的颜色称为真彩色。
•调色板技术(索引色,256色)
数据存储——存储图像
•采样 实质是把图像在空间上分割成N行M列的网格, 每一个网格就是一个像素点,也代表一个采样点。也 就是说每行获取M个像素点,总共采样N行。
M×N代表总的像素数,也称为图像的分辨率。
例如一幅1024×768的图像,代表水平方向 (横)上有1024个像素点,垂直方向(竖)上有768 个采样点,图像的分辨率为1024×768。 同一幅图像,如果分辨率越高,则描述的图像细 节越丰富,图像越细腻、逼真,但所需的存储空间也 会越大。 24/45
位率:单位时间内产生的音频数据位数。 量化位数为B,采样率为S,则位率为S×B(存储每 秒音频需要的位数)
8/45
数据存储——存储音频
•对比不同的采样、量化、编码
采样频率11KHz 8位量化
采样频率22KHz 16位量化
9/45
数据存储——存储音频
•数字化音频的数据量
采样是对模拟信号在时间轴上进行数字化,而量化是 对模拟信号在幅度上的数字化,编码则是将量化后得到的数 据表示成二进制数据, 数据量(B)=采样频率×量化位数×采样时间×声道数÷8
6/45
数据存储——存储音频
例如:假设声音的幅度值范围是0-4,将0-4 之间的幅值分成了8等份,每份为0.5. 则在0-0.5之间的所有数值均用0表示,0.5-1 之间的数值均用0.5表示,1-1.5之间的数值均用1 表示,…,3.5-4之间的数值用3.5表示。 可见量化的作用是使幅值数字化,即把无限 个数值用有限个数来表示。 量化不可避免的存在偏差。如果分成16个量化 区间(量化等级为16),每份为0.25. 则0-0.25之间的数值用0表示,0.25-0.5之间 的数值用0.25表示,…,3.75-4之间的数值用3.75表 示,这时的偏差比分成8个区间要小。 7/45
•真彩色可表示约1677万种颜色, 许多应用中并不需要,且占用 较大的空间。 •从大的颜色集中选择一些颜色 (通常256种,深度为8)并对 其建立索引(取值0~255) •扫描图像时,对每个像素,使 用索引值表示其颜色。
28/45
数据存储——存储图像
•存储空间(位图)
图像存储空间(字节)=分辨率×量化位数÷8 例:一幅图像的分辨率为640×480,色彩深度为24位, 则该图像文件的大小是多少?
奈奎斯特理论(采样定理): 采样频率不低于声音信号最高 频率的两倍,即可将以数字表达的声音还原成原来的声音。 5/45
数据存储——存储音频
•量化(离散化幅度) 将幅值在最大值和最小值之间划分N个区间, 一般采用等分方式。
幅度
时间
如上图所示的量化过程采用了8个量化区间 (也称量化等级为8),把位于一个量化区间内的 采样点的值归为一类,即赋予相同的量化值。
数据存储——存储音频
•编码(采样值如何表示) 是指将量化后的样本值按照对应的量化等级, 用若干二进制位(也叫量化位数)表示的过程。 对于幅值为0-4,若量化等级为8,可用3位的 二进制数来表示样本值的大小,如用000表示0, 001表示0.5,010表示1,…,111表示3.5。
同理,若量化等级为16,则用4位的二进制数 来表示样本值的大小。
25/45
数据存储——存储图像
对于灰度,用0(二进制00000000)代表黑,255 (11111111)代表白。0-255之间的数代表灰,显然 数值越大,灰度越浅。
灰 度 编 码
26/45
数据存储——存储图像
③彩色图像,红色用8位,绿色用8位,蓝色用8位, 则量化位数为24位,这样可以有256种红色(R)、 256种绿色(G)、256种蓝色(B)。
21/45
数据存储——存储图像
•颜色模型
品红(255,0,255)
蓝(0,0,255)
青(0,255,255) 白(255,255,255)
相关主题