网络摄像机和视频服务器作为网络应用的新型产品,适应网络传输的要求也必然成为产品开发的重要因素,而这其中视频图像的技术又成为关键。
在目前中国网络摄像机和视频服务器的产品市场上,各种压缩技术百花齐放,且各有优势,为用户提供了很大的选择空间。
JPEG 、M-JPEG有相当一部分国内外网络摄像机和视频服务器都是采用JPEG,Motion-JPEG压缩技术,JPEG、M-JPEG采用的是帧内压缩方式,图像清晰、稳定,适于视频编辑,而且可以灵活设置每路的视频清晰度和压缩帧数。
另外,因其压缩后的格式可以读取单一画面,因此可以任意剪接,特别适用与安防取证的用途。
Wavelet Transform小波变换也属于帧内压缩技术,由于这种压缩方式移除了图像的高频成分,仅保留单帧图像信号,特别适用于画面变更频繁的场合,且压缩比也得到了一定的提高,因此也被一些网络摄像机和视频服务器所采用,例如,BOSCH推出的NetCam-4系列数字网络摄像机,深圳缔佳生产的NETCAM系列网络摄像机等。
H.263H.263是一个较为成熟的标准,它是帧间预测和变换编码的混合算法,压缩比较高,尤其适用低带宽上传输活动视频。
采用H.263技术生产的网络型产品,其成本较为适中,软/硬件丰富,适合集中监控数量较多的需求,如深圳大学通信技术研究所开发的SF-10网络摄像机和SF-20视频服务器,深圳新文鼎开发的W750视频服务器和W74GM网络摄像机等采用的都是这一压缩技术。
MPEG-4MPEG-4的着眼点在于解决低带宽上音视频的传输问题,在164KHZ的带宽上,MPEG-4平均可传5-7帧/秒。
采用MPEG-4压缩技术的网络型产品可使用带宽较低的网络,如PSTN,ISDN,ADSL等,大大节省了网络费用。
另外,MPEG-4的最高分辨率可达720×576,接近DVD 画面效果,基于图像压缩的模式决定了它对运动物体可以保证有良好的清晰度。
MPEG-4所有的这些优点,使它成为当前网络产品生产厂商开发的重要趋势之一。
另外,也有部分厂商采用的是MPEG-1,MPEG-2压缩格式,除此之外,有的厂商还采用多种压缩技术相结合的方式,例如,有些国外推出的网络摄像机,其压缩方式就是MPEG-4,与JPEG 相结合,在可以看到JPEG静止图像的同时,利用MPEG-4高级压缩功能,令到高质量的动态图像也能在低带宽上传输。
纵观以上这些压缩技术,虽然MPEG-4以其良好的图像压缩性能,可支持非常低的宽带上达到视频会议的质量,从而成为未来网络型产品开发的主流方向,但就现在市场的应用情况来看,MPEG-4暂时还没有占到主导地位,究其原因,主要是由于虽然MPEG-4的国际标准已经制定,但MPEG-4的算法是公开的因而厂商各自为政,良莠不齐,对后续的二次开发带来了严重的影响,另外,MPEG-4在图像质量上也有待提高,在复杂的网路环境中,数据流过大时易导致数据流失。
另一方面,如此多种类的压缩技术,也让用户在选购网络摄像机和视频服务器时,产生了不少的困扰,有的用户要求网络传输达到实时,有的要求图像质量高,有的又要求后端存储系统容量足够大…….对于网络型产品而言,网络传输速率、图像质量和系统存储容量都与产品所用的压缩方式密切相关,三者又互相制约,因此很难做到三者同时达到最理想的状态,只能从三者中寻求一个平衡点,即用户本身真正实际的需求。
很多厂商建议用户在选择网络摄像机和视频服务器时,首先应明确系统已有的资源,以及系统所要达到的实际效果,不必一味追求市场上所谓的“热门”产品或成本。
视频压缩格式的分析和对比(MJPEG、MPEG-4、H.264等)1.H.261H.261又称为P*64,其中P为64kb/s的取值范围,是1到30的可变参数,它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的。
实际的编码算法类似于MPEG算法,但不能与后者兼容。
H.261在实时编码时比MPEG所占用的CPU运算量少得多,此算法为了优化带宽占用量,引进了在图像质量与运动幅度之间的平衡折中机制,也就是说,剧烈运动的图像比相对静止的图像质量要差。
因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。
2.H.263H.263是国际电联ITU-T的一个标准草案,是为低码流通信而设计的。
但实际上这个标准可用在很宽的码流范围,而非只用于低码流应用,它在许多应用中可以认为被用于取代H.261。
H.263的编码算法与H.261一样,但做了一些改善和改变,以提高性能和纠错能力。
.263标准在低码率下能够提供比H.261更好的图像效果,两者的区别有:(1)H.263的运动补偿使用半象素精度,而H.261则用全象素精度和循环滤波;(2)数据流层次结构的某些部分在H.263中是可选的,使得编解码可以配置成更低的数据率或更好的纠错能力;(3)H.263包含四个可协商的选项以改善性能;(4)H.263采用无限制的运动向量以及基于语法的算术编码;(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法;(6)H.263支持5种分辨率,即除了支持H.261中所支持的QCIF和CIF外,还支持SQCIF、4CIF和16CIF,SQCIF相当于QCIF一半的分辨率,而4CIF和16CIF分别为CIF的4倍和16倍。
1998年IUT-T推出的H.263+是H.263建议的第2版,它提供了12个新的可协商模式和其他特征,进一步提高了压缩编码性能。
如H.263只有5种视频源格式,H.263+允许使用更多的源格式,图像时钟频率也有多种选择,拓宽应用范围;另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率,增强了视频信息在易误码、易丢包异构网络环境下的传输。
另外,H.263+对H.263中的不受限运动矢量模式进行了改进,加上12个新增的可选模式,不仅提高了编码性能,而且增强了应用的灵活性。
H.263已经基本上取代了H.261。
二、M-JPEGM-JPEG(Motion- Join Photographic Experts Group)技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理,把运动的视频序列作为连续的静止图像来处理,这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可进行精确到帧的编辑,此外M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软件实现。
但M-JPEG只对帧内的空间冗余进行压缩。
不对帧间的时间冗余进行压缩,故压缩效率不高。
采用M-JPEG数字压缩格式,当压缩比7:1时,可提供相当于Betecam SP质量图像的节目。
JPEG标准所根据的算法是基于DCT(离散余弦变换)和可变长编码。
JPEG的关键技术有变换编码、量化、差分编码、运动补偿、霍夫曼编码和游程编码等M-JPEG的优点是:可以很容易做到精确到帧的编辑、设备比较成熟。
缺点是压缩效率不高。
此外,M-JPEG这种压缩方式并不是一个完全统一的压缩标准,不同厂家的编解码器和存储方式并没有统一的规定格式。
这也就是说,每个型号的视频服务器或编码板有自己的M-JPEG 版本,所以在服务器之间的数据传输、非线性制作网络向服务器的数据传输都根本是不可能的。
三、MPEG系列标准MPEG是活动图像专家组(Moving Picture Exports Group)的缩写,于1988年成立,是为数字视/音频制定压缩标准的专家组,目前已拥有300多名成员,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。
MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组合编码。
后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为现在制定“活动图像和音频编码”标准的组织。
MPEG组织制定的各个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。
1.MPEG-1标准MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码。
该标准包括五个部分:第一部分说明了如何根据第二部分(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。
第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。
第五部分是一个用完整的C语言实现的编码和解码器。
该标准从颁布的那一刻起,MPEG-1取得一连串的成功,如VCD和MP3的大量使用,Windows95以后的版本都带有一个MPEG-1软件解码器,可携式MPEG-1摄像机等等。
2.MPEG-2标准MPEG组织于1994年推出MPEG-2压缩标准,以实现视/音频服务与应用互操作的可能性。
MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,编码码率从每秒3兆比特~100兆比特,标准的正式规范在ISO/IEC13818中。
MPEG-2不是MPEG-1的简单升级,MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。
MPEG-2特别适用于广播级的数字电视的编码和传送,被认定为SDTV和HDTV的编码标准。
MPEG-2图像压缩的原理是利用了图像中的两种特性:空间相关性和时间相关性。
这两种相关性使得图像中存在大量的冗余信息。
如果我们能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输频带。
而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。
一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。
MPEG-2的编码图像被分为三类,分别称为I帧,P帧和B帧。
I帧图像采用帧内编码方式,即只利用了单帧图像内的空间相关性,而没有利用时间相关性。
P帧和B帧图像采用帧间编码方式,即同时利用了空间和时间上的相关性。
P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。
P帧图像中可以包含帧内编码的部分,即P 帧中的每一个宏块可以是前向预测,也可以是帧内编码。
B帧图像采用双向时间预测,可以大大提高压缩倍数。
MPEG-2的编码码流分为六个层次。
为更好地表示编码数据,MPEG-2用句法规定了一个层次性结构。
它分为六层,自上到下分别是:图像序列层、图像组(GOP)、图像、宏块条、宏块、块。
MPEG-2标准在广播电视领域中的主要应用如下:(1)视音频资料的保存一直以来,电视节目、音像资料等都是用磁带保存的。
这种方式有很多弊端:易损,占地大,成本高,难于重新使用。
更重要的是难以长期保存,难以查找、难以共享。
随着计算机技术和视频压缩技术的发展,高速宽带计算机网络以及大容量数据存储系统给电视台节目的网络化存储、查询、共享、交流提供了可能。