当前位置:文档之家› 1.3 多媒体技术简介

1.3 多媒体技术简介


数据压缩分类
无损压缩 ——利用数据的统计冗余进行压缩,原理是统计被压缩数据中重复数据的出 现次数进行编码(可逆编码) 常用于文本、程序、重要图形(图像) 常用无损算法:

行程编码 熵编码
有损压缩 ——压缩后的数据不能够完全还原成压缩前的数据,与原数据不同但是非常 接近的压缩方法(不可逆编码) 常用于音频、图像、视频 常用有损算法
(2).数字图像的获取
1)画面划分成M×N阵列网格,每个网格为一个取样点(像素) 2)将每个取样点的颜色分解成R、G、B三基色(灰度,黑白则不分色)
模 拟 图 像
3)测量每个取样 点的分量的亮度 值
4)对取样点的每个分量的亮度值 进行A/D转换,用8~12位二进制 正整数表示
扫描
图像数据量=像素总数×图像深度÷8 R 取样 量化 例:一幅1024× 768的24 位真彩图像的容量为: 244 数 1024×768×24÷8= 2304×1024B 字 G 取样 = 2304KB≈2.25MB 分色 量化 255 图 容量与分辨率、图像深度有关 像 B 取样 量化 154
(3).图像的表示与压缩编码
图像深度:一个像素的所有颜色分量的二进位数目之和 彩色图像的像素通常由3个彩色分量组成

假设3个分量分别用8个二进位表示,则可表示224=16,777,412 种 不同的颜色
静止图像压缩编码的国际标准
JPEG标准(文件扩展名是 .jpg)

是第一个静止图像压缩的国际标准 制定了二种压缩编码的方案:
编码:将所有样 把每个样本从模拟量转换 本的二进制代码 成(8位或16位)数字量 位数越大,样本精度越高, 组织在一起,并 进行数据压缩 同时需要的存储空间也越 多
(2). 数字声音的压缩编码
波形声音的主要参数

取样频率、量化位数、声道数目、使用的压缩编码方法、比特率
比特率/码率:指每秒钟的数据量


计算公式:(数字声音未压缩前)
波形声音的码率=取样频率×量化位数×声道数 (b/秒)
例:某 PC 机的声卡在处理单声道声音信息时,采样频率
为 44kHz,A/D转换精度为16位。若连续采集2分钟的声 音信息,则在不进行压缩编码的情况下保存这段声音,需 要的存储空间
44K×16×(60×2)÷ 8 ≈ 11MB

声波转换为电信号
采样、量化
模 拟 声 音
麦克风 (microphone)
声音卡 (sound card)
数 字 声 音
输出设备音响等
输 出
声音的数字化
A/D转换器——模拟/数字转换器
采 样
D/A转换器——数字/模拟转换器
量 化
模拟声音信号
01100011001· · · 数字声音
输 出
目的:把时间上连续的信号 转换成时间上离散的信号 采样频率:每秒钟采样的次 数。 一般取声音频率的2倍 采样频率越高(44KHz), 声音还原越好

实时性。用户可实时地控制多媒体信息
媒体的数字化及 数据压缩
1、数字声音
(1)波形声音的获取与播放 声音由振动产生,通过空气进行传播的 连续的波(声波),它由许多不同频率 的谐波组成。 带宽:谐波的频率范围 多媒体处理的声音主要是人耳可听到的 声音(audio)
全声道:20Hz~20kHz 语音(人的说话声音): 300~3400 Hz
音压缩编码
(3)常用的数字声音格式
.wav 文件格式 Windows采用的波形文件存储格式,数据量大; .midi 文件格式(其他扩展名: .mid 、 .r mi) 规定了乐器、计算机、音乐合成器以及其他电子设备之间交换音乐信息的一组标 准。 Midi文件记录的是乐曲演奏的内容,而不是实际的声音; 数据量极小,易于编辑、处理 缺点:播放的声音效果依赖于播放MIDI的硬件质量,只能合成音乐,不能合成歌 曲和语言; 产生MIDI音乐的方法:FM 合成法、波表合成法。
全频带声音压缩编码标准
编码简单,用于数字盒式录音磁带
名称
MPEG-1层1 MPEG-1层2 MPEG-1层3
压缩后的码率(每个声道) 声道数目
192kbps(压缩4倍) 128kbps(压缩6倍) 64kbps(压缩12倍) 2 2 2
主要应用
数字盒式录音带 DAB,VCD Internet,MP3音乐
能力的计算机 多媒体的特性

信息媒体的多样性。 交互性。用户可主动地编辑、处理各种信息, 具有人机交互功能。

电视不是多媒体系统,能传播但不能编辑、处理 多媒体信息

集成性。多媒体技术中集成了许多单一的技术, 如图像处理、声音处理技术等。

对用户而言,它们是集成一体的,包括信息的统 一获取、存储和组织

预测编码 变换编码 基于模型编码 分形编码 矢量量化编码

点位图:用 M(列)×N(行) 个像素表示图 像

动态图像(视频)
——多幅(帧)静态图像以每秒≥25幅的 速度播放时,利用视觉暂留现象就成为连续 图像,一般伴随声音。(获取设备:摄像 头、摄像机等) 取样视频 计算机合成视频

矢量图形
矢量图:用一 些指令表示一 幅图。 例: 画1条100像 素长的红色直 线 画1个半径为 50像素的圆
第1章 计算机基础知识
1.3 多媒体技术简介
多媒体的概念与 特点
媒体(又称:媒介/媒质/载体) 指文字、声音、图象、动画和视频等内容 多媒体:以上两个或以上对象的组合 多媒体技术 利用计算机技术对多媒体进行采集、操作、编 辑、存储等综合处理的技术。 多媒体计算机( MPC):具有多媒体处理
.tiff——广泛应用于桌面出版系统、图形系统、广告制作
系统,用于一种平台到另一种平台间图形的转换; .png——图像文件格式。开发目的:替代GIF、TIFF文件格 式 .wmf——是大多数Windows应用程序都可以有效处理的格 式。桌面出版系统中常用的图形格式; .dxf 文件——向量图形格式,绝大多数绘图软件均支持的 格式。
Mp3 文件格式
采用MPEG-1层3(Layer 3)标准对WAV音频压缩而成
其它文件格式
.voc ——声霸卡中使用 .au ——UNIX工作站中使用 .aif ——苹果机中使用
媒体的数字化及 数据压缩
2、图像
点位图像
(1)图像分类 静态图像
取样图像(点阵图像、位图图像)——从 现实世界中通过数码相机或扫描仪等设备 获取的图像。 矢量图像(图形)——使用计算机合成或 制作的图像
算法复杂度中等,用于数字音频广播(DAB)和VCD等 编码较复杂,用于互联网高质量声音的传输,如MP3音乐(压缩 10倍, 1张CD光盘可存100首MP3歌曲)
有线电话通信系统(国际电信联盟ITU)

G.711:PCM编码,码率:64kb/s G.721:ADPCM编码,码率:32kb/s
移动通信和IP电话:由于带宽较窄,必须常用更有效的语
离散余弦变换为基础的有损压缩编码方案 以预测技术为基础的无损压缩编码方案

JPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数 码相机中已得到广泛应用。 最新版本:JPEG 2000

(4).常用的数字图像格式
.bmp——是Windows采用的图像文件存储格式;
.gif——供联机图形交换使用,目前在网络中广泛使用; .jpg(jpeg)——是第一个静止图像压缩的国际标准
相关主题