数字图象编码Digital Image Coding课程目的•了解图象和视频编码技术的发展历程;•掌握基本信源压缩编码原理;•学习各类图象和视频编码标准的不同和特点。
——为今后进行相关领域研究打好基础参考书目•Video Processing and Communications, Yao Wang, 电子工业出版社。
•Digital Video Processing,A. Murat Tekalp, 清华大学出版社。
•数字图象压缩编码,张春田,清华大学出版社。
课程内容简介第一节图像压缩编码简介Introduction第二节统计编码Statistical Coding第三节预测编码Prediction Coding第四节变换编码Transform Coding第五节其他编码方式Other Coding第六节静止图像压缩编码标准JPEG & JPEG2000第七节视频压缩编码标准Video CodingStandard(H.261/MPEG1/MPEG2/MPEG-4/H.264)第一节IntroductionEncoder---Decoder----CodecSource Code---------Channel Code---------CryptographCompression CodingLossy CompressionLossless Compression (Error-Free Compression)Picture-------Image------Frame-------FieldMoving Picture-------Sequence--------VideoA Code is a system of symbols (letters, numbers, bits and the like…)used to represent a body of information or set of events. Each piece of information or event is assigned a sequence of code symbols, called a code word…..Photo Graphics Figure …..1.1 Image and DigitalizationPixel (像素)–samplingCFA(Color Filter Array) in a digital sensorColor Filter Array on Canon 450D()RGB or RGBW in a display⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡B G R Z Y X 009.1089.0468.0014.0426.1897.0005.0515.0365.2Tri-receptor Theory of Color VisionCIE RGB primary system, which consists of colors at 700(R),546.1(G) and 435.8(B) nm.RGB CMYK XYZ YUV HSILuminance and chrominance (亮色表示)4:4:4 YCbCr(Digital lossless)4:1:1 YCbCr(DV)4:2:0 YCbCr(VCD, DVD…) 4:2:2 YCbCr(Digibeta, DVB)1.2 Why we need compression?Middle definition picture:640×480 = 307200×24bit/pixel=7.37Mb----1GB=1000 picturesImage Sequence to video:640×480×24×25=184Mb/s------1GB=43sStandard Definition Color TV(演播室):(13.5+6.75+6.75) ×8=216Mb/s------CD-ROM(640MB)40sStandard Definition Color TV(节目传输):(720×576)×25×(1+0.25+0.25) ×8=123.416Mb/sHDTV:1140×1152, 1920×1080, 1280×720-------1Gb/s ----------DVD-ROM(4.7GB, 9.8GB) Conventional Telephone-----0.3-56kbps ISDN------56kbpsEthernet-----10Mbps Broadband ISDN----100-200Mbps✓屏幕尺寸计算方法:屏幕对角线的长度(按照英寸计量,1英寸等于公制的2.54厘米)✓屏幕比例目前屏幕比例一般有4:3和16:9两种。
✓分辨率(清晰度)标准清晰度(Standard Definition)物理分辨率在720p以下的一种视频格式。
720×480高清晰度(High Definition)视频垂直分辨率超过720p或1080i。
720p、1080i与1080p三种标准形式.1920×1080超高清晰度Ultra High-Definition)4K分辨率(3840×2160 像素) 8K分辨率(7680×4320像素)1.3 How to compress the pictures and video?Redundancy :Structure RedundancyStatistical RedundancyTemporal RedundancySubjective Redundancy (Psychovisual Redundancy )Resolution :Spatial (Detail)Temporal (Motion)Contrast (Gray)人眼是一个精密系统,但不是一个精确系统。
Example:Example 3:1.4 Image Compression Processing1.5 Source Coding and Channel Coding1.6 Categorization of source coding✓Still picture coding, Motion picture coding;✓Lossy coding, Lossless coding;✓Waveform-based coding, Content-dependent coding;✓……Depend on the different coding algorithms:Prediction codingTransform codingStatistical codingSub-band codingVector Quantization CodingFractal codingContent-based coding (semantic-based, knowledge-based, object-based) ……1.7 Image and Video Compression Standard•ISO (International Organization for Standardization)国际标准化组织•ITU( International Telecommunication Union)国际电信联盟•CCITT (International Telephone and Telegraph Consultative Committee )国际电话与电报顾问委员会JPEG-----Joint picture experts groupMPEG----Moving picture experts groupVCEG----Video coding experts groupJVT----Joint video teamA VC---Advanced video codingA VS---Audio video coding standard workgroup of China第二节人眼视觉系统和质量评价2.1 人眼视觉系统人类视觉系统(the human visual system, HVS)是神经系统的一部分,神经系统是一个非常复杂的通信网络。
在这个网络中通信是通过神经细胞——神经元进行的,并由一个十分强大的计算机——大脑来管理。
2.2 人眼视觉特性✓视觉的适应✓绝对视觉阈✓阈值对比度✓光谱灵敏度✓分辨力•明视觉•暗视觉•中介视觉•颜色适应3×10-5cd/m 23cd/m 23×105cd/m 2暗视觉明视觉中介视觉明视觉响应:人眼适应大于或等于3cd/m2的视场亮度时,视觉由锥状细胞起作用。
暗视觉响应:人眼适应小于或等于3×10-5cd/m2的视场亮度时,视觉由杆状细胞起作用。
(夜间的灰白)中介视觉响应:视场亮度介于明、暗视觉响应之间时,视觉响应逐渐由锥状细胞转向杆状细胞起作用。
当视场亮度发生突变时,人眼的适应主要包括明暗适应和色彩适应。
人眼的适应性光谱灵敏度•光谱灵敏度(光谱光视效率):人眼对各种不同波长的辐射光有不同的灵敏度(响应),对大量正常视力观察者的实验表明:–在较明亮环境中,人眼视觉对波长0.555μm左右的绿光最敏感;–在较暗条件下,人眼视觉对波长0.512μm左右的黄绿光最敏感;下图给出不同视场亮度下,人眼的光谱光视效率曲线:暗视觉明视觉◆人眼分辨力⏹人眼的分辨力:人眼能区分两发光点的最小角距离称为极限分辨角θ,其倒数为人眼分辨力。
⏹从内因分析,影响分辨力的因素为眼睛的构造。
⏹从外因分析,是目标的亮度与对比度。
人眼会根据外界条件自动进行适应,从而可以得到不同的极限分辨角。
人眼视觉惰性一般将人眼亮度感觉变化滞后于实际亮度变化,以及视觉暂留特性,总称为视觉惰性。
一般在电影播放中每秒放24幅固定的画面,电视每秒传送25~30幅图像,就可以使人眼感觉为连续活动的图像。
与视觉惰性紧密联系的还有临界闪烁频率,它是指刚好不引起闪烁感觉的最低频率。
School of Electronic Information Engineering , Tianjin University局部门限效应在出现亮度跳变的两侧,亮度变化的可觉察门限会提高。
这种现象是边缘“掩盖”了人对其邻近处信号的感觉,使人对这一局部区域信号的感觉不如没有这个边缘时灵敏、精确了。