音频数据的压缩
网络与多媒体技术
10.1 数据压缩概述
衡量一种数据压缩技术的好坏有三个重要的指标
压缩比 图像质量或音质 压缩和解压的速度
数据压缩原理
原始的多媒体信源数据存在着客观上的大量冗余。信 息理论认为:若信源编码的熵大于信源的实际熵,该 信源中一定存在冗余度。去掉冗余不会减少信息量, 仍可原样恢复数据;但若减少了熵,数据则不能完全 恢复。不过在允许的范围内损失一定的熵,数据仍然 可以近似恢复。
网络与多媒体技术
10.1 数据压缩概述
数据压缩技术标准
H.263:在H.261的基础上发展而来的加强版,它借鉴 了MPEG-1的优点,支持PSTN,能在低带宽上传输高 质量的视频流。 H.264:由ISO/IEC(IEC,国际电工委员会)与ITU-T 组成的联合视频组(Joint Video Team,JVT)制定 的新一代视频压缩编码标准。在相同的重建图像质量 下,H.264比H.263+和MPEG-4减小50%码率,对信道 时延的适应性较强,既可工作于低时延模式以满足实 时业务,如会议电视等,又可工作于无时延限制的场 合,如视频存储等;提高网络适应性,加强对误码和 丢包的处理,提高解码器的差错恢复能力。
网络与多媒体技术
10.2 音频数据的压缩 音频信号压缩编码的主要依据是人耳的听 觉特性,主要有两点: • 1.人的听觉系统中存在一个听觉阈值电平, 低于这个电平的声音信号人耳听不到 . • 2.人的听觉存在屏蔽效应。当几个强弱不同 的声音同时存在时,强声使弱声难以听到,并 且两者之间的关系与其相对频率的大小有关 . 声音编码算法就是通过这些特性来去掉更 多的冗余数据,来达到压缩数据的目的。
网络与多媒体技术
10.1 数据压缩概述
数据压缩原理
变换编码。有失真编码。对原始数据从初始空间或时 间域进行数学变换,使得信号中最重要的部分在变换 域中易于识别,并且集中出现,可以重点处理;相反 使能量较少的部分较分散,可以进行粗处理。 三个步骤:变换、变换域采样和量化。 分析—合成编码。有失真编码。通过对原始数据的分 析,将其分解成一系列更适合表示的“基元”或“参数”, 编码仅对这些基本单元或参数进行。而译码时则借助 于一定的规则或模型,按照一定的算法将这些基元或 参数再“综合”成原数据的一个逼近。
网络与多媒体技术
10.1 数据压缩概述
数据压缩原理
因为人的感觉的某些不敏感性,多媒体数据中还存在 着从主观感受角度看去的大量冗余,即:在人眼允许 的误差范围之内,压缩前后的图像如果不做非常细致 的对比是很难觉察出两者的差别的。 统计编码:无失真编码。根据信息出现概率的分布特 性进行的压缩编码。 预测编码:有失真编码。根据原始的离散信号之间存 在关联性的特点,利用前面的一个或多个信号对下一 个信号进行预测,然后对实际值和预测值的差进行编 码。网络与多ຫໍສະໝຸດ 体技术10.1 数据压缩概述
数据压缩技术标准
H.26X。由CCITT(Consultative Committee of International Telegraph and Telephone 国际电报电 话咨询委员会,从1993年3月1日起,改组为ITU)制 定的标准。包括H.261、H.263、H.264,简称为H.26X 主要应用于实时视频通信领域 H.261:是ITU-T为在综合业务数字网(ISDN)上开展 双向声像业务(可视电话、视频会议)而制定的,速 率为64kb/s的整数倍。H.261只对CIF(352×288)和 QCIF(176×144)两种图像格式进行处理。H.261是 最早的运动图像压缩标准。
• 常用工具:WinRar、WinZip、ARC等
网络与多媒体技术
10.1 数据压缩概述
数据压缩方法 有损压缩:
• 利用了人类视觉和听觉器官对图像或声音中的某些 频率成分不敏感的特性,允许在压缩过程中损失一 定的信息;虽然不能完全恢复原始数据,但是所损 失的部分对理解原始图像或声音的影响较小,却换 来了大得多的压缩比。有损压缩广泛应用于语音、 图像和视频数据的压缩。 • 常用的有损压缩方法有:PCM(脉冲编码调制)、预测 编码、变换编码(主要是离散余弦变换方法)、插值和 外推法(空域亚采样、时域亚采样、自适应)等等。 • 常用工具:JPEG、MPEG等
网络与多媒体技术
10.1 数据压缩概述
数据压缩方法
无损压缩:
• 利用数据的统计冗余进行压缩,可完全恢复原始数 据而不引入任何失真,但压缩率受到统计冗余度理 论限制,一般为2:1到5:1。 • 多媒体应用中经常使用的无损压缩方法主要是基于 统计的编码方案,如游程编码(run length)、 Huffman编码、算术编码和LZW编码等等。
第十章 多媒体数据压缩技术
计算机网络与多媒体技术
网络与多媒体技术
多媒体关键技术
10.1
10.2 10.3
数据压缩概述
音频数据的压缩
静态图像的数据压缩
10.4
运动图像的数据压缩
网络与多媒体技术
10.1 数据压缩概述
由于多媒体数据量非常大,造成计算机的存储和网络传输负担 若帧速率为25帧/秒,则1s的数据量大约为25MB,一个640MB 的光盘只能存放大约25s的动态图像 一幅640×480分辨率的24位真彩色图像的数据量约为900KB; 一个100MB的硬盘只能存储约100幅静止图像画面 解决办法之一就是进行数据压缩,压缩后再进行存储和传输, 到需要时再解压、还原。 以目前常用的位图格式的图像存储方式为例,像素与像素之间 无论是在行方向还是在列方向都具有很大的相关性,因而整体 上数据的冗余度很大,在允许一定限度失真的前提下,能够对 图像数据进行很大程度的压缩。
网络与多媒体技术
10.2 音频数据的压缩
声音信号的基本参数: 频率:信号每秒钟变化的次数。次声、可听声和超声 振幅:声波波形的最大位移。 音频压缩标准: 电话质量的语音压缩标准:300Hz~3.4KHz。当采样频 率为8KHz,量化位数为8bit时所对应的速率为6kbit/s。 调幅广播质量的音频压缩标准:50Hz~7KHz。当使用 16KHz的抽样频率和14bit的量化位数时,信号速率为 224kbit/s。符合1988年ITU制定的G.722标准。 高保真立体声音频压缩标准:50Hz~20KHz。在44.1KHz 抽样频率下用16bit量化,信号速率为每声道705kbit/s。 目前比较成熟的标准为“MPEG音频”。