多媒体数据的封装
ASF最适于通过网络发送多媒体流,也同样适于在本地播 放。任何压缩/解压缩运算法则(编解码器)都可用来编码ASF 流。
OGM是一种多媒体容器文件,视频常用XVID、 DIVX等编码,音频采用Vorbis、OGG、AC3、MP3等 编码,相比于DIVX AVI、MPEG-1 VCD文件更小,音 质画质更高。
TS RM AVI ASF MKV MP4 MOV OGM WMV …
音频视频交叉存取格式
在AVI文件中,运动图像和伴音数据是以交织 的方式存储。这种按交替方式组织音频和视像数 据的方式可使得读取视频数据流时能更有效地从 存储媒介得到连续的信息。从尾部的索引可以索 引跳到自己想放的位置。AVI中图像和声音是分开 的,所以播放时需要一个图像和声音的同步过程。
OGM可以方便的嵌入多个音轨和字幕,然后只要 安装了相应的解码器,就可以使用wmp6.4无困难的播 放,OGM在索引上要远快于AVI,拖动进度条再也不用 像AVI情况下等上好一阵子,同时Chapter又可以把DVD 中的章节信息完美载入。而且在声画同步上OGM做得 更好,不用出现某些AVI情况下画面要快进才能赶上声
音的场面,同时在制作上还能进一步节省为同步而占用 的空间。
RM格式是RealNetworks公司开发的一种流媒体视频文件 格式(性质是一种多媒体视频文件容器格式),其文件扩展名 是".rm"。RM格式一开始就定位在视频流应用方面,也可以说 是视频流技术的始创者。它的诞生,也使得流文件为更多人所 知。
MKV是Matroska的一种多媒体容器文件,是一种 新的多媒体封装格式。
Matroska最大的特点就是能容纳多种不同类型编 码的视频、音频及字幕流,并将它们的音视频进行了重
新组织来达到更好的效果,它能将多种不同编码的视频 以及16条以上不同格式的音频和不同语言的字幕封装到 一个文件中;具有良好的开放性和跨平台性,是H.264 编码最重要的封装格式。
但由于MOV没有什么商业背景,几乎只活跃在PC平台上,尽管其功 能丰富,但在商业应用中则毫无建,且与AVI同期推出,已过时。
MPG格式文件扩展名.mpg/.mpeg。MPEG是运动 图像压缩算法的国际标准,包括MPEG-1/,MPEG2/MPEG-4三个版本,采用有损压缩方法减少运动图像中 的冗余信息,同时保证每秒30帧的图像动态刷新率, MPG有可能基于其中任一种压缩标准出现,现已被几乎 所有的计算机平台支持。
相较DVDrip(所有以DVD为片源重新压缩编码的文件)而言,首 先在保证影片整体视听效果的前提下,RMVB的个头只有 300~450MB左右(以90分钟的标准电影计算),而DVDrip却需要 700MB甚至更多;其次RMVB的字幕为内嵌字幕,不像DVDrip那样 要安装调试字幕外挂软件,有时还会出现乱码;更重要的是RMVB的 影音播放只需一次性安装完解码器,以后无论影像还是音效都无需另 行调试。而DVDrip却视频、音频解码一大堆,设置不当还会造成音画 不同步、花屏失声等等毛病。
数据引用用来描述数据源。数据引用可能指向一个本地文件,也可能 是一个网络或英特网服务器上的文件,或者来自网络或英特网服务器上的流 ,还可能指向一个内存块的句柄或者指针;其它数据引用类型也是可能的, 并且类型本身是可扩展的。简而言之,MOV格式文件数据可以位于任何地 方。一个给定的轨道只能对应一种媒体类型,而且大部分的轨道都从单一 的数据源获取所有的样本数据。然而某些媒体类型支持多个数据源。比如 一个视频轨道可能是有一系列的存储在不同文件的JPEG图像组成的。在这 种情况下,每个图像都有一个数据源。
适用领域
独立于硬 件设备
TS
头部、主体、时间戳 支持
从视频流的任意片段开始都是 可以独立解码的
Videocodecs、MPEG-2、 MPEG-4 AVC、SMPTE VC1、Audio codecs、Linear PCM、DolbyDigital、 Dolby Digital Plus、Dolby TrueHD、DTS DigitalSurround、DTS-HD
包头+负载
视频、音频的PES包以及辅助数据
节目专用信息PSI
节目关联表PAT 节目映射表PMT 条件接收表CAT 网络信息表NIT
1.节目专用信息PSI 几类表格对的PID
PAT 0x0000 PMT 0x0002 CAT 0x0001 NIT 0x0010
PAT提供了节目号和对应PMT表的PID对应关系。
MPEG压缩标准是针对运动图像而设计的,其基本方法是:在单位 时间内采集并保存第一帧信息,然后只存储其余帧相对第一帧发生变化的 部分,从而达到压缩的目的,它主要采用两个基本压缩技术:运动补偿技 术(预测编码和插补码)实现时间上的压缩,变换域(离散余弦变换DCT)压缩 技术实现空间上的压缩。MPEG的平均压缩比为50∶1,最高可达200∶1, 压缩效率非常高,同时图像和音响的质量也非常好,并且在微机上有统一 的标准格式,兼容性相当好。
特点:兼容性好、跨平台支持、恒定帧率, 体积大、容错性差、不是流媒体、过时。
RIFF—资源互换文件格式
AVI文件采用RIFF文件结构方式。RIFF是微软公司定义的一 种用于管理windows环境中多媒体数据的文件格式,构造RIFF文 件的基本单元叫做数据块,每个数据块包括3个部分:4字节的 数据块标记(数据块的ID)、大小、数据。整个RIFF文件可以看 成一个数据块,其数据块ID为RIFF,称为RIFF块。一个RIFF文件 中只允许存在一个RIFF块。RIFF块中包含一系列的子块,其中有 一种字块的ID为“LIST”,称为LIST块,LIST块中可以再包含一系列 的子块,但除了LIST块以外的其他所有子块都不能再包含子块。 RIFF块和LIST块分别比普通的数据块多一个被称为形式类型和列 表类型的数据域,其组成如下:4字节的数据块标记、数据块的 大小、4字节的形式类型或者列表类型、数据。
MPEG-1被广泛地应用在VCD的制作,绝大多数的VCD采用MPEG-1 格式压缩。MPEG-2应用在DVD的制作方面、HDTV(高清晰电视广播)和 一些高要求的视频编辑、处理方面。MPEG-4是一种新的压缩算法,使用这 种算法的ASF格式可以把一部120 min长的电影压缩到300 M左右的视频流, 可供在网上观看。
类型 文件结构 AVI 头部、主体、索引
音视频同步 特色
缺点
支持的编码格式
不支持
运动图像和伴音数据以交织的 方式存储,并独立于硬件设备
AVI中图像和声 音是分开的,播 放时需要一个同 步的过程
Videocodecs/MPEG-4 AVC/SMPTE VC-1/Audio codecs/DTS/AC3
MOV又是一个发展很快的多媒体封装形式,它具有很多 优越性。它可称为万能封装器,连多条字幕文件都可以封装进 去。同时,MOV还具有良好的兼容性、跨平台性、纠错性,所 要求的存储空间小等技术特点。到目前为止,它共有4 个版本 ,其中以 4.0 版本的压缩率最好。这种编码支持16位图像深度 的帧内压缩和帧间压缩,帧率每秒10帧以上。
MKV采用了可变帧率,在回放变化比较慢(比如说静物)时以比 较低的FPS(每秒帧数)来代替,可以节省不少资源;MKV与AVI和TS相 比还增加了错误检测以及修复,这无疑提供了纠错和容错性,更适合于
网络传输;在字幕方面,还增加了软字幕(也称“外挂字幕”,把字幕 文件单独保存为ASS、SSA或SUB格式,只需与视频文件名相同,播放时 自动调用,也可用MKV进行封装。)功能。与DVDrip以及HDrip等字幕以 其它文件形式存在不同的是,在MKV里字幕可以内嵌在封装里,但不会 和视频混淆,也可以多字幕随意选择;这样在传输保存时更为方便。在 传输上采用的是流式传输,这点和TS流的原因基本一致,可以通过时间 戳来管理视频以及音频的同步问题,做到即下即看。
这类文件可以实现即时播放,即先从服务器上下载一部分视频文件, 形成视频流缓冲区后实时播放,同时继续下载,为接下来的播放做好准备。 这种“边传边播”的方法避免了用户必须等待整个文件从Internet上全部下 载完毕才能观看的缺点,因而特别适合在线观看影视。RM主要用于在低速 率的网上实时传输视频的压缩格式,它同样具有小体积而又比较清晰的特点。
特点:开放、跨平台、可变帧率、纠错和容错性好、支持多音轨、 软字幕、流式传输、兼容性好
MOV它是Apple公司开发的一种音频、视 频文件格式,默认播放器是QuickTimePlayer, 用于存储常用数字媒体类型,如音频和视频。 扩展名为.mov。现在MOV格式常常被用来制 作高清电影预告片,可以达到1080P的所谓全 高清标准。
MOV格式文件是以轨道(track)的形式组织起来 的。一个MOV格式文件结构中可以包含很多轨道。轨道 的数目限制有一些经验值,这些值会因为计算机的能力 越来越强大而发生改变,然而MOV格式文件本身并没有 预定义的轨道数目限制。
每个轨道都有一个具体的媒体类型(比如视频, 声音,或者文本)和一个指定轨道样本数据位置的数据 引用。轨道结构中可以也会指定压缩格式(比如JPEG视 频或者GSM音频)。
MKV MOV MPG ASF
OGM RM
支持 支持
采用可变帧率,增加了错误检 测以及修复
万能封装器,连多条字幕文件 几乎之活跃在PC
都可以封装
AVI的RIFF块的形式类型是“AVI”,包含3个子块:信息块、数据块、索引块
TS全称MPEG2-TS,TS是Transport Stream 的缩写。MPEG2-TS格式的特点就是要求从视频 流的任一片段开始都是可以独立解码的。主要用 于实时传送的节目如实时广播的电视节目。
TS分包发送,每一个包场为188字节(也有 192和204字节的包,这是由于通信媒介为包添加 错误校验字节),包结构为:包头4字节,负载 184字节。TS流中可以填入很多类型的数据,如 视频、音频、自定义信息等。
PMT指示组成某一套节目的视频、音频和数据在传送流中的位置,即对应视频包、音 频包、数据包的PID值,以及每路节目的节目时钟参考(PCR)字段的位置。