第二章 视频压缩标准及应用
速率控制 输入 图象分块 — DCT 量化 熵编码 缓冲器 输出
运动估计与运动补偿 DCT图象压缩编码原理框图
一、MPEG—1视频压缩技术 MPEG—1是第一个标准,主要应用于视频信号的数字化压缩 存储。码率为1.5Mbps, 图象质量相当于VHS的水平。其主要特点: 1、 MPEG—1将电视图象帧分三类 I、B、P 2、 MPEG—1的码流语法结构 这个语法结构把图象压缩数据码流分为六层,每层或者支 持一种信号处理过程,或者支持一种系统功能。 块: MPEG算法中最小的编码单位,包含8×8个像素,是 图象信息之一:Y、U、V。块是帧内编码的 基本单元。 宏块: MPEG算法中基本编码单元。包含16 ×16个图象块。 宏块由四个亮度块、若干个色差块及附加数据构成。附加数据 包括宏块的编号、编码类型、量化参数、运动矢量等信息。
176 128
88 64
144 96
72 48
可视电 话 Internet
科学实验表明:人眼对从纯黑到纯白分辨灰度级为64级,用 6比特来表示图象的灰度级就够了,实际中为提高质量,减低噪声, 采样过程中,最低用256级取样电平,即每个取样点需要用 8比特 来表示,广播级的图象处理采用10、12、14比特。 活动图象数字化后数据速率: 13.5×8(Y) + 6.75 ×8(U) + 6.75 ×8(V)=216Mbps=27MB/s CCIR601建议 规定正程扫描52 μs ,一行采样点数 52 ×13.5=702点,压缩算法要求水平方向上的采样点必须为32或 16的倍数,通常704取720点。有效行625-50=575取576。 4:2:2格式数字图象数据速率: (704 ×576+352 ×576 +352 ×576) ×8 ×25=162201600bit/s=162.2Mbit/s 162.2/216=75%
二、MPEG ( Moving Picture Expert Group) MPEG分系统、视频、音频三部分 MPEG-1 位率1.5Mbps, 用于家用视音频处理标准,VCD。 MPEG-2位率4-10Mbps,图象质量近于演播室质量,DVD。 MPEG-4、MPEG-7概述 4.7G DVD-R/RW记录视频的规格
三、视频信号的数字化
1、模拟视频信号行场结构 PAL制:行频 15625Hz,场频 50Hz ,25帧,每帧2场; 一行扫描时间64 μs (=1/15625 s),其中12 μs是行消隐, (4.7 μs同步头);有效显示时间52 μs。 一帧(副)画面扫描行 625行(=15625/25) 其中50行为场消 隐,有效行为575行这样有效行场数只占总数的75%。
第二节
数字视频信号分析
2、彩色空 G B
0.299 0.587 0.144 = -0.1678 -0.3313 -0.5 0.5 -0.4187 -0.0813
= 1 1 1 0 -0.34414 1.1772 1.042 -0.71414 0
R G B
Y U V
4:2:2方案中的编码参数植
参数 编码信号 Y,Cr, Cb 每行的样本数: Y Cr, Cb 采样频率: Y 13.5MHz 13.5MHz 858 429 864 432 525行/59.94Hz场速率系统 (NTSC) 从加玛预校正信号中获得 625行/50Hz场速率系统 (PAL) 从加玛预校正信号中获得
352x240
360x480
352x240
一、图象和视频数据的处理 1、图象的数据模型 图象信息在数学上可表示为 I=f (x,y,z,t,λ) 其中 ( x,y,z)是三维空间坐标;t 代表时间,形成活动图象; λ 是波长,它对图象 类型产生影响。 Fr=25/30Hz 帧速率 一般用于电视的隔行扫描,每帧由奇、偶两场组成。 HDTV系统Fr=50-60Hz , 当Fr=50-60Hz 时基本上没有闪烁现象,高质量的工 作站显示器通常使用这种帧率。
每条扫描线每4个连 续的采样点取4个Y、 2个Cr、2个Cb样本, 每一个像素用2个样 本表示。 是子采样格式
4、数字视频的比特率和所需存储容量
比特bit(位):计算机中信息的最小量。数据速率/码流 常用bps(比特/秒)。 字节Byte:存储一个字符所需存储量。通常表示磁盘容量和文件大小。 1Byte=8bite 常用单位及换算: 1KB=1024B; 1MB=1024KB; 1GB=1024MB; 1TB=1024GB; 1PB=1024TB; 1EB=1024PB; 以PAL ITU-R601标准,625/50电视系统的一帧D1质量的电视图象,采用 Y:U:V=4:2:2,8bit量化,数据速率: 720×576 × (1+0.5 +0.5) × 8 × 25=165888000bit/s(bps)=20736000B/s=19.78MB/s; 每帧图象的数据为: 720 × 576 × (1+0.5 +0.5) × 8=6635520bit=0.791M B. DV格式:速率25 Mbits/s ,一小时节目所需要的容量为: 25 × 3600/8=11250MB=10.986328125GB=11GB. 1394/DV接口速率 100/200/400 Mbits/s SDI 接口速率 270 Mbits/s
每条扫描线每4个连 续的采样点取4个Y、 1个Cr、1个Cb样本, 每一个像素用1.5个样 本表示。 是子采样格式
V(12)0 V(12)1
4:4:4
每条扫描线每4个连 续的采样点取4个Y、 4个Cr、4个Cb样本, 每一个像素用3个样 本表示。 不是子采样格式
4:2:0
在水平和垂直方向每2个连 续的采样点取4个Y、 1个Cr、1个Cb样本, 每一个像素用1.5个样 本表示。 是子采样格式
Y10 Y20
Y11 Y21
Y12 Y22
Y13 Y23
U10 U11 U12 U13
U20 U21 U22 U23 V10 V11 V12 V13 V20 V21 V22 V23
U10 U20 V10 V20 4:2:2
U11 U21 V11 V21
U10 U20
U(12)0 U(12)1
V10 V20 4:1:1
3、图象子采样
对彩色电视信号采样时,有两种方法:一是用同一种采样频率对图象的亮度、色差 信号进行采样;二是对色差信号采用比亮度信号低的频率采样,这就是图象子采样。
Y10 Y11 Y12 Y13 Y20 Y21 Y22 Y23
Y10 Y11 Y12 Y13 Y20 Y21 Y22 Y23
Y10 Y11 Y12 Y13 Y20 Y21 Y22 Y23
Cr, Cb
编码形式 每个数字活动行的样本数
6.75MHz
正规PCM,8位/样本
6.75MHz
正规PCM,8位/样本
Y
Cr, Cb 模拟与数字水平时序关系: 从数字活动行结束到行同步的 上升沿
720
360 16个色度时钟周期
720
360 12个色度时钟周期
二、数字图象处理系统
图象通信
图象获取 摄像机 照相机 扫描仪 图象处理 显示输出 TV彩色监视器 打印机
数字化AV信号的取样频率fs ,量化位数为R,则其二进制编 码的传输速率(或称位率、码率、比特率、数据率)I= fs × R bps(b bit; ps per second) 数字电话的fs= 8 kHz, R = 8 bit,I= 8 × 8=64 kbps; CD-DA的音频信号的每一路fs= 44.1 kHz, R = 16 bit, I= 44.1 × 16=705.6 kbps,立体声信号为; I= 1.4112 Mbps; 视频信号的带宽为6M, 采样定理要求,取样频率 应是信号带宽的2倍以上。 CCIR规定采样频率13.5MHz, 13.5MHz/15625=864=13.5MHz×64 μs, 色度信号的带宽为1.3MHz,取样频率为6.75MHz。
4、SIF(source input format)格式定义两种位流格式
PAL 352像素*288行*25Hz NTSC 352像素*240行*30Hz 因为SIF帧速率是NTSC和PAL场速率的1/2,所有视频显示硬件必须把每 个SIF帧显示两次。 5、ITU-R601编码方案 国际电信联盟无线电通信部门以演播室质 量标准,把模拟的Y U V与分量编码使用的Y Cb Cr在彩色空间具有数字等 价性。
2、数字化
常见数字视频格式(PAL)
图像格式 水平样点数 垂直样点数(行 数) 典型应 用
亮度
4:2:2 704
色度
352
亮度
576
色度
576 MPEG2
4:2:0
HHF CIF
704
352 352
352
176 176
576
576 288
288
288 144
MPEG2
S-VCD VCD
QCIF SQCIF
3、标准视频NTSC(美国国家电视系统委员会)和PAL(Phase lternating Line)逐行倒相格式,SECAM(Sequential Color and memory)串行色彩存储格式。 标准 NTSC PAL 行数/帧 行数/场 525 625 262.5 312.5 活动视频行 场速率 480 576 59.94 50 水平同步脉冲速率 15734 15625
13.5MHz
4:2:0 8 DV 5:1
13.5MHz
4:2:2 8 DV 3.3:1
数据率
音频
18Mb/s
16b/48KHz
4声道
25 Mb/s
16b/48KHz
2声道
50 Mb/s
16b/48KHz
4声道
25 Mb/s